Semalt: Zeskrob dowolną stronę internetową jednym kliknięciem myszy

WebHarvy jest jednym z najlepszych danych skrobania i narzędzi internetowych indeksowania w sieci. Służy do zeskrobywania obrazów, adresów URL, tekstu i wiadomości e-mail z dużej liczby witryn. Dzięki WebHarvy możesz zapisywać treści internetowe w różnych formatach i wyciągać przydatne dane za pomocą zaledwie kilku kliknięć.

Złap różne witryny:

Korzystając z WebHarvy, możesz łatwo zeskrobywać adresy URL, adresy e-mail, zdjęcia, pliki wideo i audio oraz tekst ze stron internetowych. W trybie konfiguracji wystarczy przesunąć wskaźnik myszy na stronę, a dane zostaną automatycznie zeskrobane. Możesz także podświetlić informacje, które chcesz zeskrobać, a WebHarvy natychmiast zacznie wykonywać swoją funkcję. Po wyodrębnieniu dane są podświetlone na żółtym tle i można sprawdzić ich jakość. O dziwo, WebHarvy naprawia wszystkie drobne błędy w twoich plikach i wyświetla ostateczny wynik w oknie Capture. Jeśli dane nie są podświetlone na żółtym tle, należy zmienić ustawienia narzędzia i natychmiast uruchomić je ponownie, aby uzyskać dobre wyniki.

Zidentyfikuj podobne elementy danych:

Dzięki WebHarvy możesz zidentyfikować podobne elementy danych i pozbyć się treści niskiej jakości. Na przykład, jeśli wcześniej zeskrobałeś określoną stronę i zapomniałeś o niej, WebHarvy nie wyodrębni danych z tej samej strony i zaoszczędzisz czas i energię. Zamiast tego możesz uzyskać dostęp do tych danych w bazie danych WebHarvy i natychmiast pobrać je na dysk twardy. Podobnie można przechwytywać więcej elementów danych ze strony za pomocą tego narzędzia i wykonywać wiele zadań zgarniania jednocześnie.

Zeskrob obrazy za pomocą WebHarvy:

Podczas konfigurowania, kiedy klikniemy plik PNG lub JPG, WebHarvy natychmiast rozpocznie zgarnianie. Po rozpakowaniu obraz jest automatycznie pobierany na dysk twardy lub przechowywany w bazie danych WebHarvy do użytku offline. Za pomocą tej usługi możesz jednocześnie zgarnąć do 100 plików obrazów i dokumentów PDF na raz. Opcji „Przechwyć obraz” można również użyć do zeskrobania dokumentów HTML. Można także zastosować wyrażenia regularne, aby uzyskać adres URL obrazu w mgnieniu oka.

Zeskrob dokumenty HTML:

Dzięki WebHarvy możesz zeskrobać dokumenty HTML za pomocą kilku kliknięć. W tym celu należy wybrać opcję „Przechwyć HTML” i kliknąć przycisk „Więcej opcji” w oknie Przechwyć. Tutaj wyświetlony zostanie kod HTML wybranego elementu. Kliknij przycisk „Przechwyć HTML” i przechwyć HTML wybranego elementu.

Interfejs wskaż i kliknij:

WebHarvy jest najbardziej znany z interfejsu „wskaż i kliknij”. Podczas skrobania danych nie trzeba pisać kodów ani skryptów. Zamiast tego możesz używać WebHarvy do poruszania się po różnych stronach internetowych i zgarniania dowolną liczbę stron jednym kliknięciem myszy. WebHarvy automatycznie identyfikuje wzorce danych i zapewnia dokładne i wiarygodne wyniki. Możesz zapisać informacje w formacie XML, CSV, JSON i TSV. Możesz nawet skrobać strony anonimowo i zapobiegać blokowaniu twojego adresu IP przez WebHarvy.