Zarabiaj z nami

Marek Wiśniewski
Marek Wiśniewski
Subskrybuj
Twój E-mail:
Twoje Imię:

"Wszystko o wyszukiwarkach" cd 4

Marek Wiśniewski

loocky Inmarket

“Więcej wiadomości na temat… znajdziesz, zapisując się na bezpłatny newsletter umieszczony po prawej”.

Inmarket Biznes

Problemy związane z wyszukiwaniem




Język polski jest bardziej skomplikowany niż język angielski. Język polski jest fleksyjny, język angielski jest pozycyjny. Oznacza to, że o roli i znaczeniu wyrazu w zdaniu decyduje w języku polskim niekoniecznie miejsce, ale np. sposób odmiany przez dodanie odpowiedniej końcówki. W przypadku katalogowania i wyszukiwania informacji ma to ogromne znaczenie, ponieważ narzędzie stworzone do współpracy z językami pozycyjnymi nigdy nie poradzi sobie z odmianą wyrazów i określaniem ich ważności, gdy napotyka na dokument dyktowany zasadami fleksji.
Ogólnoświatowe wyszukiwarki, jak Altavista, FAST, Google, czy Inktomi, których oprogramowanie zostało napisane przez zagranicznych programistów, nie dostosowane do specyfiki naszego języka, przez co mają problemy z poprawnym wyszukiwaniem polskich treści. Przekłada się to na zaniżoną trafność odpowiedzi przy poszukiwaniu stron stworzonych w języku polskim. Najpopularniejszym sposobem zapisu wszystkich znaków na komputerach jest standard ASCII. Wszystkim najpopularniejszym łacińskim literom, znakom i cyfrom przyporządkowano numery od 0 do 128.Polskie znaki diakrytyczne zapisywane są właśnie przy użyciu liczb z przedziału między 128 a 256.Część robotów podczas indeksowania stron nie bierze pod uwagę znaków o takich kodach, gdyż traktuje je jako znaki nie drukowalne. Powoduje to, że polskie znaki rozróżniane są przez wiele systemów wyszukiwawczych jako znaki puste.
Innym problemem części wyszukiwarek, które rozpoznają znaki powyżej kodu 128, jest brak kojarzenia ze sobą różnych sposobów kodowania tych samych znaków narodowych. Tylko nieliczne wyszukiwarki rozpoznają, że znaki o różnych kodach są tymi samymi znakami. Jeszcze większym problemem dla wyszukiwarek jest skojarzenie, że "zolc" i "żółć" mogą być tymi samymi wyrazami, tylko zapisanymi na różne sposoby. Z tego typu problemami dobrze radzi sobie polska wyszukiwarka NEToskop, która bez problemu rozpoznaje, a także kojarzy polskie znaki diakrytyczne zapisane na wszystkie sposoby.
Jednym z głównych czynników utrudniających użytkownikom sieci wyszukiwanie informacji jest powszechny brak umiejętności formułowania zapytań, czyli opisu poszukiwanych dokumentów przy użyciu właściwych haseł kluczowych. Wyszukiwane treści zazwyczaj opisywane są przez internautów za pomocą małej liczby wyrazów, najczęściej jednego, co z kolei jest powodem generowania bardzo ogólnych wyników, luźno powiązanych z poszukiwanymi informacjami. Jedynym rozwiązaniem, jakie stosują niektóre wyszukiwarki jest stosowanie funkcji wspomagających użytkowników podczas procesu wyszukiwania i korygujące popełniane przez nich błędy np. "system Podpowiedzi Kontekstowych" w NEToskopie (jedyny taki w Polsce).
Duża część Internetu została opanowana przez treści wulgarne i pornograficzne, a łatwość dotarcia do nich może być zagrożeniem dla dzieci. Dlatego wyszukiwarki, powinny być wyposażone w funkcje odfiltrowywania treści wulgarnych i obscenicznych.

Rodzaje wyszukiwarek


Metawyszukiwarki
Wraz z rozwojem Internetu rośnie zapotrzebowanie na narzędzia do filtrowania i sortowania jego zasobów. Internetowe wyszukiwarki i katalogi cieszą się wobec tego większym zainteresowaniem, a to z kolei przenosi się na popularność oprogramowania wspierającego wyszukiwanie informacji.
Aplikacjami tego typu są metawyszukiwarki, czy też searchboty. To nic innego jak instalowane w komputerze programy przystosowane do jednoczesnego przekazywania zapytań do kilku lub kilkunastu internetowych wyszukiwarek czy katalogów. Z uwagi na to, że każdy z serwisów indeksujących wymaga zazwyczaj od użytkownika stosowania odrębnych reguł filtrowania, przeszukanie zasobów nawet kilku wyszukiwarek wymaga często przechodzenia od strony do strony i powtarzania w kółko tych samych komend. Wykorzystując searchboty oszczędzamy czas podwójnie: unikamy zbędnego klikania i uzyskujemy wyniki od razu z wielu źródeł. Jakby tego było mało, wraz z programem otrzymujemy najczęściej szereg innych mniej lub bardziej przydatnych narzędzi, które pomagają adekwatnie do potrzeb zagospodarować zdobyte informacje. Przykładami takich programów są np. Copernic 2001 Basic, Bingooo, Answwwer, PICgrabber, 007 GoldenEye
Na podobnej zasadzie działają serwisy "wszystko w jednym" (ang. "all in one") Po połączeniu się z takim serwisem użytkownik wpisuje słowa kluczowe w odpowiedni formularz, wyszukiwanie zostaje zlecone kilku znanym wyszukiwarkom. Proces wyszukiwania jest więc znacznie ułatwiony a wyniki poszukiwań trafniejsze. Ich przykładami są m.in.:
MetaCrawler
MetaCrawler Serwis zleca wyszukiwanie sześciu wyszukiwarkom: AltaVista, Excite, Infoseek, Lycos, WebCrawler i Yahoo. Przy każdym znalezionym dokumencie znajduje się dodatkowo informacja o wyszukiwarce, dzięki której dokument został odszukany.
Metasearch
Adres: Po wpisaniu słowa kluczowego w odpowiedni formularz, zostaje ono przekazane wyszukiwarkom współpracującym z serwisem, a użytkownik musi sam zdecydować, która z nich zostanie uruchomiona.
Wyszukiwarki specjalne
Sposobem na zwiększenie szansy znalezienia poszukiwanej informacji w sieci WWW są wyszukiwarki wyspecjalizowane. Zasadniczą różnicą między wyszukiwarką wyspecjalizowaną a zwykłą jest zawartość ich zasobów. Wyszukiwarka wyspecjalizowana zawiera w katalogu linki tylko do takich stron, które odpowiadają profilowi danej wyszukiwarki. Innym sposobem na efektywniejsze wyszukiwanie informacji są wyszukiwarki nowej generacji. Oprogramowanie sortujące tych wyszukiwarek decyduje o trafności wyboru odpowiednich linków z bazy danych na podstawie pewnych algorytmów. Jednym ze sposobów jest obliczanie, ile razy dana strona była odwiedzana przez użytkowników i jak długo użytkownicy pozostawali na tej stronie (wg założenia, że strona lepsza jest częściej odwiedzana przez użytkowników). Drugim sposobem jest wyznaczenie trafnej strony na podstawie liczby linków prowadzących do tej strony z serwisów "autorytatywnych" (zawierających odpowiednio duży zasób wartościowych informacji na poszukiwany temat). Przykładowe wyszukiwarki specjalne:
Shareware.com - poszukiwanie plików:
Wyszukiwarka Shareware.com (usługa dawniej znana pod nazwą VSL - Virtual Software Library) pomoże użytkownikowi odszukać nie tylko miejsce, z którego można skopiować dany plik, ale także umożliwi poznanie dokładnej jego nazwy w przypadku, gdy użytkownik zna jedynie nazwę opisową, np. "cybersky". Próba odnalezienia programu o dokładnie nie sprecyzowanej nazwie jest niemożliwa za pomocą np. usługi Archie. Wyszukiwarka Shareware.com swym zasięgiem obejmuje najbardziej znane archiwa oprogramowania: Simtel, Microsoft, Sunsite, Garbo, Hobbes, itd. Jeżeli poszukiwany program znajduje się w archiwach, które posiadają mirrory (tzn. lustrzane odbicia), wyszukiwarka poda użytkownikowi ich adresy; może się jednak zdarzyć, że nie obejmie mirrorów polskich.
FTP Search:
Wyszukiwarka FTP Search umożliwia zawężenie poszukiwań do wybranej domeny, np. pl. Wymagana jest dokładna nazwa szukanego programu.
Lista niektórych wyszukiwarek internetowych
Google - http://google.com
Altavista - http://www.altavista.com
Fast - http://www.fast.no
Netoskop - http:www.//netoskop.pl
Netsprint - http://www.netsprint.pl
Szukacz - http://www.szukacz.pl
EuroSeek - http://euroseek.com
Excite - http://www.excite.com/
Go.com http://go.com/
Yahoo - http://www.yahoo.com/
Lycos - http://www.lycos.com/
WebCrawler - http://www.webcrawler.com/
AOL search - http://search.aol.com/aol/webhome
Magellan - http://www.mckinley.com/
Galaxy - http://galaxy.einet.net/
JumpCity - http://www.jumpcity.com/search-page.html
OneKey - http://www.onekey.com/
Lonely Planet - http://www.lonelyplanet.com/dest/dest.htm
Virtual Tourist - http://www.vtourist.com/webmap/
Big Foot - http://www.bigfoot.com/
Strona WWW: http://www.samsung1ns2.implesite.pl/
cdn..

Komentarze (0) | Dodaj komentarz | Edytuj | Usuń | sobota, 28 czerwiec 08, 22:54

Login/E-Mail:
Hasło:

Zapomniałeś hasła?

Nazwa użytkownika:  
E-mail:  
Hasło:  
Imię:  
Nazwisko:

Następne: "Wszystko o wyszukiwarkach" cd 5

Poprzedni: "Wszystko o wyszukiwarkach" cd 3


Każdy może zdobywać, publikować i sprzedawać każdy rodzaj wiedzy na Ekademii. Znajdziesz tutaj darmowe i płatne kursy e-learningowe, e-booki, serwisy abonamentowe, płyty DVD i CD oraz wejściówki na szkolenia i konferensje.
Pomiń Co się ostatnio działo?

Co się ostatnio działo?

Aktywność od czwartek, 2 luty 2012, 05:17

Brak zmian od ostatniego zalogowania

Pomiń Zalogowani Użytkownicy

Zalogowani Użytkownicy

(ostatnie 5 minut)
Żaden