Vsebina:
- Zbiranje podatkov
- Predloge
- Ustvarjanje nalog
- Shranjevanje in spreminjanje nastavitev nalog
- Predstavitev nalog in upravljanje
- Dodatna orodja
- Izvoz podatkov
- Proxy strežniki
- Blokiranje oglasov
- Oblačne storitve
- Lekcije o uporabi
- Tehnična podpora
- Prednosti
- Slabosti
- Prenesite preizkusno različico Octoparse
- Vprašanja in odgovori: 1
Zbiranje podatkov
Octoparse – je celovita programska rešitev za množično in avtomatizirano zbiranje (spletno strganje), strukturiranje in analizo podatkov, za uporabo katere ni potrebno znanje programiranja. S pomočjo tega lahko katerikoli nestrukturirani spletni podatki postanejo pripravljena informacijska baza za marketing, raziskave, prodajo, promocijo in reševanje številnih drugih poslovnih nalog.

Glede na to, na katerih spletnih straneh se bo programska oprema uporabljala, je mogoče pridobiti podatke in/ali vsebino naslednjih vrst: cene in informacije o izdelkih (za trgovske platforme); objave, publikacije, komentarji (družbena omrežja); cene, ocene, mnenja (rezervacije, nepremičnine); delovna mesta in plače (delo) itd.

Obravnavana programska oprema deluje pod nadzorom edinstvenega algoritma, ki temelji na umetni inteligenci, kar omogoča samodejno iskanje in pridobivanje podatkov s spletnih strani po vnaprej določenih ali predlogah parametrov.

Predloge
Storitev ponuja več kot 200 pripravljenih predlog za zbiranje podatkov s spletnih strani v naslednjih kategorijah:
- Priljubljene spletne storitve;
- Spletne trgovine in tržne platforme (Amazon, eBay, Walmart itd.);
- Hoteli in potovanja (Airbnb, Booking, Tripadvisor itd.);
- Družbena omrežja in mediji (Facebook, Instagram, Twitter, YouTube itd.);
- Iskalniki (Google, Yahoo);
- Oglasi (Crunchbase, Rumene strani, Yelp itd.);
- Kartažni servisi (Google);
- Ocene;
- Iskanje zaposlitve;
- Nepremičnine;
- Šolsko izobraževanje;
- Finančne storitve;
- Stave.













Ustvarjanje nalog
Poleg predlog lahko v Octoparse ustvarite tudi svoje lastne naloge za pridobivanje podatkov s spleta. Ta postopek se izvede v treh preprostih korakih: navedba URL-naslova strani, s katere je treba zbrati podatke, izbira cilja in nato zagon ter neposredno pridobivanje.
Postopek je izjemno preprost in avtomatiziran – sistem prepozna ključne elemente na spletnih straneh in jih označi (osvetli), kar ne le zagotavlja dodatno udobje pri interakciji, temveč tudi prihrani čas. Še pomembneje je, da tak pristop izključuje potrebo po znanju in uporabi jezika XPath za samostojno ustvarjanje XML-poizvedb.

Shranjevanje in spreminjanje nastavitev nalog
Med avtomatskim pridobivanjem informacij in na podlagi vsebine, odkrite na spletnem mestu, Octoparse ustvari lastne nastavitve, ki jih je mogoče shraniti kot predloge in pripravljene za nadaljnjo uporabo ali pa jih spremeniti po lastni presoji, na primer, tako da izključite nekatere kategorije in dodate druge ali preprosto spremenite njihovo zaporedje.

Očitno je, da potreba po spreminjanju osnovnih nastavitev, ki določajo končno predstavitev zbranih podatkov, nastane precej pogosto. Sprva so prikazane v obliki pregledne tabele z avtomatsko določenimi kategorijami in vrstnim redom, stolpci, ki jih je mogoče zamenjati, in nepotrebne, ki jih je mogoče preprosto odstraniti.

Poleg tega je pogosto potrebno in priporočljivo samostojno določiti takšne parametre, kot so število strani na spletnem mestu in interval dostopanja do njih.

Po avtomatskem ali samostojnem določanju nastavitev, zagonu in zaključku neposrednega procesa pridobivanja se ustvari delovni predloga (workflow), ki je sestavljen iz več blokov – urejenih elementov, katerih končni videz določa, kako bo naloga izgledala na koncu.

Predstavitev nalog in upravljanje
Končane naloge se dodajo na nadzorno ploščo (dostopna iz zgornjega in stranskega menija), od koder lahko izvajate takšne dejavnosti, kot so zagon in ustavitev procesa pridobivanja, deljenje s sodelavci, izvoz, ogled lokalnih podatkov in podatkov, shranjenih v oblaku.

Za lažje iskanje in upravljanje je priporočljivo ustvarjati skupine, po potrebi pa lahko naloge premikate iz ene kategorije v drugo.

Dodatna orodja
V okviru aktualne (beta) različice Octoparse so na voljo dve dodatni orodji, ki širita funkcionalne možnosti te programske opreme in omogočata učinkovitejše delo s podatki. Tako RegEx Tool omogoča čiščenje zbranih informacij, medtem ko Database Auto Export Tool omogoča določitev lastnega urnika za izvoz v lokalno bazo.

Izvoz podatkov
Zbrani podatki s pomočjo Octoparse se po potrebi lahko shranijo v formatih XLSX, CSV, JSON itd. za nadaljnjo obdelavo v zunanjih programskih orodjih, kot sta Excel ali Ajax. Prav tako je na voljo možnost izvoza v baze podatkov.

Proxy strežniki
Obravnavana programska oprema omogoča uporabo lastnega proxy strežnika v procesu zbiranja podatkov. Tako lahko skrijete ali samodejno zamenjate svoj IP naslov, da se izognete uvrstitvi na črno listo obdelanih spletnih virov.
Blokiranje oglasov
Octoparse vsebuje sredstva za blokiranje oglasov, kar skrajša čas nalaganja strani in dostopov do njih ter posledično optimizira in pospeši reševanje osnovnih delovnih nalog.
Oblačne storitve
Za zagotavljanje varnosti in zanesljivosti procesa spletnega strganja Octoparse uporablja napredne tehnologije oblačnih računalništva lastne zasnove ter omogoča dostop do svojih storitev in strežnikov, katerih hitrost delovanja je do 20-krat višja kot pri lokalnih analogih.

Lekcije o uporabi
Na uradni spletni strani Octoparse je predstavljena izčrpna knjižnica učnih materialov, s katerimi lahko v najkrajšem možnem času obvladate vse funkcionalne možnosti tega programske opreme, da jo kar najbolj učinkovito uporabite za organizacijo delovnih procesov in reševanje poslovnih nalog. Do njih lahko dostopate tudi iz vmesnika programa, njegovega glavnega okna.

Tehnična podpora
V primeru težav pri uporabi in/ali težav pri delovanju Octoparse se lahko vedno obrnete na službo tehnične podpore storitve spletnega strganja podatkov. Na voljo so naslednji komunikacijski kanali: elektronska pošta, forum in skupnost, družbena omrežja ter klepet v živo (na voljo le v plačljivem paketu). Pri tem je treba omeniti, da je za pridobitev odgovorov na določena vprašanja pogosto dovolj, da se obrnete na bazo znanja, predstavljeno na spletni strani, ali na že omenjene učne materiale.

Prednosti
- Na voljo 14-dnevna brezplačna preizkusna različica;
- Enostaven in intuitiven uporabniški vmesnik;
- Ni potrebe po programerskih veščinah;
- Možnost uporabe oblačnih storitev podjetja razvijalca;
- Na voljo izobraževalni materiali za uporabo programske opreme;
- Tehnična podpora z več komunikacijskimi kanali;
- Obsežna knjižnica pripravljenih predlog, ki jih je mogoče po potrebi prilagoditi svojim nalogam;
- Podpora najbolj priljubljenim spletnim mestom in storitvam različnih usmeritev in tematik.
Slabosti
- Pomanjkanje ruščine;
- Pomanjkanje predlog za domače spletne strani;
- Ob trenutku pisanja pregleda so aktualne različice Octoparse za Windows in macOS na voljo le v beta različici. Prejšnja (stabilna) se razlikuje od nje po uporabniškem vmesniku in funkcionalnosti.
Prenesite preizkusno različico Octoparse
Prenesite najnovejšo različico programa s uradne spletne strani