Az elmúlt hétvégén, illetve előtte is, meg ma is az indexer hegesztésével foglalkoztam. Elsőre sajnos hibás volt a dátumszűrő, és túl sok oldalt dobott ki, drámaian lecsökkentve ezzel az indexelhető lapok számát.
Kénytelen voltam a korábbi adatbázist összekeverni ezzel az újabbal, és a kettőt együtt kitenni, így a régiből az állásajánlatok megmaradtak, csak az újból lett kevés. Ennek viszont az lett a következménye, hogy tele lett az adatbázis már lejárt hirdetésekkel. Mivel ezt a letöltött anyagból döntjük el, és a letöltés, ehez az adatbázishoz január végén történt, a már akkor is kint lévő hirdetések egy része pedig időközben lejárt.
Ezeken kívül, átállítottam az eredménylistát olyanra, hogy az oldalak címe, illetve az url helyett relevánsabb szövegeket tegyen ki. A keresőnk kezd "szemantikus" keresőként működni, mert például ez a címsorbeli szöveg a h1/h2 html tagagből származik. Ezt is módosítottam most, de ez majd csak a következő adatbázisban lesz látható, kiterjesztettem a h1/h2 címsor elemzést olyan div,td,th tag-ekre, amelyekben az class, illetve az id nevében szerepel "title" vagy "cim". Néhány oldalon ilyen tag-ekbe pakolták az állásajánlat megnevezését. A felhasználás nem automatikus, csak akkor jelenik meg a h1/h2 tartalma, ha abban van felismerhető foglalkozás-név, elkerülendő a site önreklámját, vagy irreleváns tartalmakat, pl híreket.
Ami még mindig fájdalmas jelenség, hogy előkerülnek nem állásajánlatok a szűrő után is, illetve olyan oldalak, amelyeken egyszerre több állásajánlat kilistázása található.
Megkezdődött a korábbiaknál agresszívebb kereső-jelenlét. Ezt túlzás lenne seo-nak nevezni, "ráeresztettem" a google-t a search.jsp-re, vagyis az eredménylistára. Megjelent az oldalon egy "utolsó keresések" rovat, a felhasználói élmény fokozása mellett ezzel az is a cél, hogy a kezdőoldalon legyen állásneveket mint anchor text tartalmazó linkek, amelyek saját oldalra mutatnak. Ezzel szeretném képbe hozni a google adatbázisát is, hogy végül is mivel is foglalkozunk itt...
Utolsó kommentek