Fennakadás

12.
október

Fennakadás

Az elmúlt kb 1.5 hétben fennakadás volt a crawler futtatásában, nem sikerült keresztülvergődni néhány hibán, ami a program alrendszereiben, illetve a feldolgozott adatokban egyszerre volt jelen. Most újrafuttattam a crawlert, és ehhez hozzácsaptam az előző adatbázist is, most összesen kb 5000 oldalunk van, ebből kb 2500 ami az új futtatásból származik, a másik fele pedig régi (szept. 30)

Sajnos az ezt okozó hibát azóta sem sikerült felderíteni. Az a feltételezésem, hogy a crawler menet közben olyan linkeket talált, amelyek szűrése közben, a szűrést végző regex kifejezés elfagyott. A crawlereket a futtatást követően lényegében végtelen ciklusban találtam, le kellett őket kill-elni, linux paranccsal. Most bevezettem egy olyan szűrést, hogy a 100 karakternél hosszabb url-eket hagyja figyelmen kívül. Remélem ez nem fog a kérdéses linkek esetén sem elfagyni, merthogy ez az ellenőzés nem java kód szinten van, hanem ez is egy regex kifejezés...

Egyelőre a kisebbik rossz, hogy a hiba valószinűleg újra elő fog fordulni, a nagyobb hogy emiatt nem tudtuk az adatbázist frissíteni. Ez most megtörtént.

Facebook Tumblr Tweet Pinterest Tetszik

Címkék: hiba huba jobkereso jobkereső

Szólj hozzá!

A bejegyzés trackback címe:

https://jobkereso.blog.hu/api/trackback/id/tr102365043

Kommentek:

A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.

Utolsó kommentek

jobkereso: Üdv, ennél picit több információt szeretnék! A jobkereso@gmail.com címen tudunk privát beszélget... (2014.09.12. 22:51) Átalakítás 2. fázis
: Jogilag a tartalomátvételt engedélyezed-e (majd feed-en keresztül ha lesz)? Az adott cikkre mutatn... (2014.09.12. 19:20) Átalakítás 2. fázis
: Szia! RSS feed lesz? (2014.09.12. 19:17) Átalakítás 2. fázis
padisah: Üdv jobkereso@gmail.com (2014.07.10. 23:25) Amazon átállás
madinfo.hu: Kapcsolatfelvételhez e-mail címet technikai kérdésekben hol találok? (2014.07.10. 09:47) Amazon átállás
Utolsó 20

jobkereső

állásokat kereső robot fejlesztése

közvetlen-állások

Próba Cseresznye

Utolsó kommentek

12.
október

Fennakadás

Címkék: hiba huba jobkereso jobkereső

Szólj hozzá!

A bejegyzés trackback címe:

Kommentek:

jobkereső

állásokat kereső robot fejlesztése

közvetlen-állások

Próba Cseresznye

Utolsó kommentek

12.október

Fennakadás

Címkék: hiba huba jobkereso jobkereső

Szólj hozzá!

Ajánlott bejegyzések:

A bejegyzés trackback címe:

Kommentek:

12.
október