Semalt: Web Scrapper Chrome Uzantısı Nasıl Kullanılır

İnternet üzerinden çok miktarda veri mevcuttur. Verileri doğrudan bir siteden kullanılabilir bir veritabanına kopyalamaya çalışmak emek yoğun bir süreç olabilir. Bu nedenle, web sitelerinden veri ayıklamak için bir web kazıma yöntemi kullanarak zaman, enerji ve paradan tasarruf edebilirsiniz.

Web Veri Çıkarma veya Web Toplama olarak da bilinen Web kazıma, sitelerden veri ayıklamak için botları kullanma işlemidir. Web kazıyıcılar bir sitede gezinir, içeriğini değerlendirir ve daha sonra çekip bir e-tabloya veya veritabanına yerleştirir.

Piyasada mevcut web kazıma araçları bol, ama onlar oldukça pahalı ve teknoloji meraklı olmayan insanlar için kullanımı kolay değil. Ancak, Web Scraper Chrome Uzantısı ücretsiz ve kullanımı kolaydır. Bu eklenti ile süreci çalışmasının ortasında bile durdurabilirsiniz.

Web Scraper Chrome Extension yazılımını Google Chrome Web Mağazası'ndan indirebilirsiniz. Tek dezavantajı, siteyi manuel olarak kazımanız ve kolay bir işlem olmamasıdır. Ayrıca, programlı olarak düzenli aralıklarla kazıma yapamazsınız.

Web Scraper Chrome Uzantısı Kurulumu

  • Google Chrome tarayıcısını açın;
  • Chrome Web Mağazası'nı ziyaret edin ve Web Kazıyıcı Uzantısı'nı arayın;
  • Aracı Chrome'a ekleyin;
  • Artık Chrome tarayıcınızı kullanarak web sitelerini kazımaya başlamaya hazırsınız.

Sıyırıcı takıldıktan sonra, Google Chrome geliştirici araçlarını açmak için F12 tuşuna basın. Alternatif olarak, ekrana sağ tıklayıp "elemanı denetle" yi seçebilirsiniz. Geliştirici Araçlarını açtığınızda, "Web Kazıyıcı" adlı bir sekme göreceksiniz.

Şimdi bunu canlı bir web sayfasında nasıl kullanacağımızı öğrenelim. Awesomegifs web sitesini kazımak istediğimizi ve siteden bazı içerik ve veriler elde ettiğimizi düşünelim. Siteyi açın. İlk gördüğünüz şey nedir? Görüntüler tembel bir şekilde yüklenmiş, değil mi?

Bir web sayfasını açtıktan sonra, gif resim URL'lerini çıkarmanız gerekir. Bu, görüntülerle eşleşen CSS seçiciyi tanımlamanız gerektiği anlamına gelir. Web sitesinde yaklaşık 130 resim var; ve sayfalar arasında geçiş yapmak için şu anda 125 olan sayfanın numarasını değiştirmeniz gerekir. Bunu yapmanın en kolay yolu yeni bir site haritası oluşturmak ve Başlangıç URL'si alanını eklemektir. Bu şekilde, Web Scraper'dan URL'yi sürekli olarak açması ve böylece işlemdeki son değeri artırması istenir. İlk sayfayı, ikinci sayfayı, üçüncü sayfayı… 125. sayfaya ulaşıncaya kadar açar.

Kazıma işlemine başlamak için site haritası sekmesini açın ve "Kazıma" yı tıklayın. Araç, gerekli verileri kazımaya başlayacaktır. Ortadaki kazıma işlemini durdurmak istediğinizde, pencereyi kapatın ve çıkarılan verileri bir CSV dosyasına aktarmak için site haritası sekmesine gidin.