1. Halo Guest, pastikan Anda selalu menaati peraturan forum sebelum mengirimkan post atau thread baru.

[ask] cara cache grab menjadi html biar tidak menjalan curl terus

Discussion in 'Pemrograman Web' started by metagenesis, Jan 3, 2013.

Tags:
  1. metagenesis

    metagenesis Super Hero

    Joined:
    May 1, 2010
    Messages:
    824
    Likes Received:
    133
    sesuai judul tread, ada yang tau gak gimana cara mencache sebuah halaman yang di grab menggunakan curl menjadi file html, jadi hanya perlu 1 kali grab n 1 kali curl setelah itu akan ada file html yang tercipta n pangunjung selanjutnya hanya mengakses cache yang ada n tidak menjalankan curl lagi, nanti kl di set 1 minggu baru cache diperbaharui, dulu pernah tau kl dak salah dom html atau apa gitu namanya, tp lupa dmana arsip codenya, klada yang tau silahkan di share ya, di tunggu infonya dari para sesepuh n suhu suhu :D
     
  2. chiman

    chiman Hero

    Joined:
    Jul 16, 2007
    Messages:
    732
    Likes Received:
    33
    Location:
    Bali
    clue:

    outputnya curl simpan ke file pake fwrite.
    setelah itu di load pake simple_html_dom atau pake DOM bawaan php jg bisa (lebih cepet)

    contohnya ada di sini:

    Code:
    http://stackoverflow.com/questions/7967531/php-curl-writing-to-file
     
  3. netrix

    netrix Super Hero

    Joined:
    Jan 5, 2009
    Messages:
    1,494
    Likes Received:
    242
    Location:
    Not Telling
    pake w3 aja kang?
     
  4. metagenesis

    metagenesis Super Hero

    Joined:
    May 1, 2010
    Messages:
    824
    Likes Received:
    133
    test dl pak kayanya ini ni
    caranya kang sekalian
     
  5. suriemie

    suriemie Ads.id Pro

    Joined:
    Sep 15, 2006
    Messages:
    404
    Likes Received:
    53
    kalo bikin dari awal saya ga pernah coba, kalo pake framework codeigniter tinggal bikin library/helper buat grab pake curl, output ke file view, trus tinggal set cache di controller mau berapa lama cachenya sebelum diperbaharui
     
  6. metagenesis

    metagenesis Super Hero

    Joined:
    May 1, 2010
    Messages:
    824
    Likes Received:
    133
    makasih info nya kang, bisa ditambah link link rujukan atau kode langkapnya mungkin, maklum newbie
     
  7. suriemie

    suriemie Ads.id Pro

    Joined:
    Sep 15, 2006
    Messages:
    404
    Likes Received:
    53
    belom pernah pake codeigniter ya? agak ribet kalo pertama kali belajar tapi kalo dah bisa, banyak ngebantu soalnya udah banyak fungsi2 bagus jadi kita ga usah bikin dari awal lagi.
    website codeigniter: _http://ellislab.com/codeigniter
    download di _http://ellislab.com/codeigniter/download
    buat install, user guide dll baca di _http://ellislab.com/codeigniter/user-guide/ . Di paling atas ada table of content, kalo di klik keluar menu lagi lengkap. tinggal cari fungsi yg dibutuhin
    kalo tentang cache bs baca di _http://ellislab.com/codeigniter/user-guide/general/caching.html
     
  8. thehoster

    thehoster Ads.id Pro

    Joined:
    Feb 14, 2010
    Messages:
    468
    Likes Received:
    61
    mungkin yang dimaksud mirror site yak pak ?
    cobain gini
    Code:
    <?php
    system('wget -mk http://detik.com'); 
    ?>
    
    jalanin di hosting ente, atau di os linux
    kalo dah selesai load, ntar cek di folder tsb ntar ada folder dengan nama domain web tsb.
     
  9. dummydecoy

    dummydecoy Super Hero

    Joined:
    Jul 18, 2010
    Messages:
    970
    Likes Received:
    297
    PHP:
    function get_cache($url)
    {
        
    $cachefile "cache/".$url.".txt";            
    if (
    file_exists($cachefile))    
    {        
      
    $filetimestamp filemtime($cachefile);        
      
    $diff time() - $filetimestamp;                
      if (
    $diff 3600*24)    //24 jam cache deh        
      
    {            
      return (
    $cachefile);        
      }    
    }    
    $content file_get_html($url);    
    file_put_contents($cachefile,$content);        
    return(
    $cachefile);

    }
    dikembangin/debug lagi deh..cm titip ini
     
  10. mp3online

    mp3online Super Hero

    Joined:
    Jul 19, 2011
    Messages:
    2,228
    Likes Received:
    294
    Location:
    jakarta
    aku pernah punya ide yg sama dg ts. pernah gugling cari "php cache" n nemu scriptnya tp lupa url nya n blm aku praktekin jg :)
    coba deh gugling pake kw itu boss
     
  11. metagenesis

    metagenesis Super Hero

    Joined:
    May 1, 2010
    Messages:
    824
    Likes Received:
    133
    dicoba dulu kang, makasih KW nya
     
  12. gembel-intelek

    gembel-intelek Lurker

    Joined:
    Mar 29, 2009
    Messages:
    4,341
    Likes Received:
    907
    Location:
    New Coral
  13. metagenesis

    metagenesis Super Hero

    Joined:
    May 1, 2010
    Messages:
    824
    Likes Received:
    133
    masternya datang, udah ubek ubek n memang ini yang dicari, oya bisa gak kang kita cache sepenggal sepenggal, misalnya

    aaaaaaaaaaaaaa
    aaaaaaaaaaaaaa
    aaaaaaaaaaaaaa
    aaaaaaaaaaaaaa

    bbbbbbbbbbbbb

    ccccccccccccc
    ccccccccccccc
    ccccccccccccc
    ccccccccccccc

    a dan c yang mau di cache sedangkan b tidak, karena b adalah iklan

    bisa gak kang
     
    Last edited: Jan 4, 2013
  14. gembel-intelek

    gembel-intelek Lurker

    Joined:
    Mar 29, 2009
    Messages:
    4,341
    Likes Received:
    907
    Location:
    New Coral
    harusnya sih bisa, coba browsing2 "php partial page cache" :D
     
  15. mp3online

    mp3online Super Hero

    Joined:
    Jul 19, 2011
    Messages:
    2,228
    Likes Received:
    294
    Location:
    jakarta
    kalau udah jadi bisikin scriptnya ya kang bro :D
     
  16. gudel

    gudel Ads.id Pro

    Joined:
    Dec 13, 2012
    Messages:
    269
    Likes Received:
    24
    Dulu sy prnh pke yg bgini,

    top_cache.php
    PHP:
    <?php
    $url 
    $_SERVER["SCRIPT_NAME"];
    $break Explode('/'$url); //Lokasi file cache
    $file $break[count($break) - 1];

    //Buat ganti cache file name. Terserah jd html ato php ato yg lain
    $cachefile 'cached-'.substr_replace($file ,"",-4).'.html';

    //Lama cache file disimpan (dlm dtk)
    $cachetime 18000;

    // Serve from the cache if it is younger than $cachetime
    if (file_exists($cachefile) && time() - $cachetime filemtime($cachefile)) {
        echo 
    "<!-- Cached copy, generated ".date('H:i'filemtime($cachefile))." -->\n";
        include(
    $cachefile);
        exit;
    }
    ob_start(); // Start the output buffer
    ?>
    bottom_cache.php
    PHP:
    <?php
    // Cache the contents to a file
    $cached fopen($cachefile'w');
    fwrite($cachedob_get_contents());
    fclose($cached);
    ob_end_flush(); // Send the output to the browser
    ?>
    Klo yg page nya ada iklannya sbaiknya jgn d psng drpd ntar fraud click. Mgk lbh tepat buat page statis. :)
     
  17. mp3online

    mp3online Super Hero

    Joined:
    Jul 19, 2011
    Messages:
    2,228
    Likes Received:
    294
    Location:
    jakarta
    kalau iklannya code javascript emang yg kechace bukan javascript ya?
    kalau masih code javascript aslinya sih kayaknya aman2 aja soalnya javascript kan baru bisa jalan kalau halamannya diload oleh browser atau istilah kerennya client side script
     
  18. metagenesis

    metagenesis Super Hero

    Joined:
    May 1, 2010
    Messages:
    824
    Likes Received:
    133
    kayanya kl iklan java script yang ke cache html kode yang sudah digenerate kang, masih ubek ubek ni
     
  19. mp3online

    mp3online Super Hero

    Joined:
    Jul 19, 2011
    Messages:
    2,228
    Likes Received:
    294
    Location:
    jakarta
    kok kayaknya? brarti blm pasti ya boss? biar lebih pasti coba buka file cachenya pake text editor, di situ kan kelihatan code html nya, yg bagian iklan yg kesimpen masih code javascript aslinya atau bukan.
    kalau javascriptnya berubah baru deh diubek2 lagi :)

    kemungkinan javascript berubah sih emang ada, dari pengalaman view source webku sendiri di browser tertentu javascriptnya udah beda. ada yg source htmlnya udah menggenerate js di header html pdhal js aslinya dipasang di body.
    di firefox 3.6.xx malah ada yg view source html yg tag script src file.js ilang yg nungul isi file.js nya.
    ada jg yg view source code htmlnya gak berubah.

    bisa jadi beberapa script cache kasusnya seperti beberapa browser tersebut.
     

Share This Page