Khai Thác Search Engine
Cho Nhu Cầu Học Tập và Nghiên Cứu - bài III

  vietsciences-Võ Quang Nhân         ngày  03 tháng 08 năm 2004
        

 

3. Chế Độ Nâng Cao Cuả Các Trang Truy Tìm

Ngoài chế độ tìm kiếm thông thường hầu hết các máy truy tìm đều hổ trợ chức năng nâng cao mà dòng liên kết cuả nó thường viết bởi cụm từ "Advanced search" hay đơn giản là "Advanced"

hình1a: Bấm lên dòng 'Advanced Search' cho chế độ nâng cao

Hình1b: một phần hình trong chế độ nâng cao cuả Yahoo

Trong chế độ này thì sự tìm kiếm được hướng dẫn chi tiết hơn (nhưng cũng  không có nghiã là dể tìm ra tất cả những gì mình muốn)

Đặc điểm chung cuả các chế độ nâng cao là:

  • Giao diện được thêm vào nhiều ô trống có dòng hướng dẫn để tiện người dùng điền vào (như điền vào các mẫu đơn xin ... thi đại học).  Không nhất thiết phải điền hết tất cả các ô trống nhưng các ô này được điền một cách đúng cách và nhiều chi tiết thì càng giúp cho máy truy tìm làm việc hiệu quả hơn

  • Đa số các search engine cho phép lọc lựa (filter) lại các thông tin như là: lựa chọn ngôn ngữ (rất tiếc là chả có cái máy truy tìm nào thèm cho truy tìm riêng các trang ... Việt ngữ!!!), lưạ chọn ngày tháng cuả trang WEB, lưạ chọn các kiểu tệp (file type) và ngay cả lọc lựa các nội dung ... chỉ dành riêng cho người lớn

  • Có thể xử dụng các phép toán đã nêu trong bài 2 để nâng cao phép truy tìm. Tuy nhiên, bạn nên cẩn thận vì có thể các kết quả sẽ chịu ảnh hưởng

4. Vài đặc thù cuả các search engines thông dụng.  Mỗi search engine có thể cung cấp thêm một số phương tiện để giảm thiểu khó khăn cuả cuả việc truy tìm nếu như bạn đã gặp (lỡ gõ) phải từ khoá có quá nhiều trang tìm được -- Có nhiều khi số trang tìm được lên đến cả tiệu trang! (vậy là từ khoá này quá chung chung). Sau đây là vài công cụ hữu ích.

4.1 Tìm thêm dữ liệu theo liên hệ (related search): Sau khi search, máy truy tìm có thể giúp bạn đào sâu sự truy tìm bằng cách cung cấp các bộ từ khoá chi tiết hơn dưới dạng các dòng link.  Các link này thu nhỏ thị trường tìm kiếm (nếu số trang tìm theo từ kháo cuả bạn là quá lớn).  Thực ra, nếu bạn biết cách chọn từ khoá cho "xít xao" thì sẽ không phải mượn đến chức năng này. Thí dụ như bạn tìm tìm các trang viết về sao hoả mà dùng từ khoá mars thì kể như ... mệt vì số lượng trang tìm ra sẽ vô cùng lớn. Do đó, bạn có thể bấm  thêm vào các chữ liên hệ để serach engine thu nhỏ thị trường tìm kiếm lại

những trang có chức năng để tìm dữ liệu theo liên hệ là: AltaVista (Related Searches), AllTheWeb (Narrow your search) , Excite(Refine Your Results), HotBot, Lycos, MSN, Yahoo (also try)

Hình2: Thu hẹp bằng cách lưạ bấm vào một link thích hợp

4.2 Chống hội tụ (cluster): trong lúc tìm kiếm nếu search engine thấy rằng các trang tìm ra có thể ở chung một trang nguồn thì chỉ chọn ra 1 trang đại diện còn các trang khác sẽ được xếp gọn vào và bạn có thể khai triển rộng ra thành nhiều trang nếu muốn ... như vậy sự tìm kiếm sẽ dể hơn và ít bị "nhiểu loạn" thông tin cuả cùng một trang

Hình3: Các hổ trợ cuả google

Những trang có chức năng này là: AltaVista(Additional relevant pages from this site), AllTheWeb(more hits from), Excite, Google(More results from), HotBot, MSN, Northern Light

4.3 Trang Tương Tự  (similar) và trang có chính tả gần giống

Trong một số trường hợp thì chức năng tìm các trang tương tự như các trang mà serach engine tìm ra có thể hữu dụng. Để dùng chức năng này bạn chỉ việc bấm vào cái liên kết tương ứng. Riêng trong google thì còn có link gợi ý thêm cho việc truy tìm bằng chữ "Did you mean ..."

Các trang có chức năng tìm trang tương tự là: AltaVista (similar pages, related pages), AOL Search (Show me more like this), Google (did you mean, similar pages)

4.4 Trang có từ nối dài (stemming): Đây là khả năng cuả một số máy truy tìm cho phép tìm những trang có chữ mà có chưá từ khoá bên trong nó.

Thí dụ, thay vi chỉ tìm chữ tutor trang sẽ tìm luôn các chữ tutors, tutorial, ...

AOL Search (mặc định), Direct Hit, HotBot(Enable Word Stemming)

4.5 Dùng chức năng tồn trữ (cache) cuả google:

Có nhiều trường hợp trang WEB đã bị xoá sổ không thể hiển thị được nưã nhưng thông tin cuả nó trong cơ sở dữ liệu cuả máy try tìm vẩn còn mà chúng ta có thể cần dùng đến. Trong thời gian các tin tức này chưa bị xoá khỏi search engine thì bạn có thể đọc được nó nhờ vào chức năng đạc biệt này cuả google

Hình4: Thông tin cũ tồn đọng trong 'cache'

Ngoài ra, trong google, bạn có thể dùng từ khoá qui ước 'cache' để đọc trực tiếp các thông tin này. (Hà hà! Trong vài trường hợp bạn có thể dùng kĩ thuật này để lôi ra các thông tin đã bị di chuyển đi nơi khác cuả các ... hackers!)

Ví dụ:

cache:cnn.com

4.6 Chuyển Dịch (translation)

Một số trang cho khả năng dịch lại trang tìm thấy sang thứ tiếng mà người dùng đang có (thường thì chỉ có dịch được ra Anh Pháp Đức hay Tây Ban Nha thôi! Nhưng cũng trặc trẹo lắm) Như vậy, bạn có thể nắm được một phần thông tin có thể dịch ra.

Các trang có chức năng chuyển dịch là:  AltaVista (Translate), Google(Translate this page)

5.7 Điạ chỉ các search engine thông dụng:

5.7.1 Trang kiểu Spider

5.7.2 Kiểu Meta:

  • Dog Pile www.dogpile.com  tìm trên LookSmart, GoTo.com, Thunderstone, Yahoo!, Open Directory, About.com, Direct Hit, Lycos, and AltaVista.

  • Meta Find www.metafind.com tìm trên Meta Find  Excite, AltaVista, Infoseek, and WebCrawler

  • Meta crawlwr www.metacrawler.com tìm trên Lycos, WebCrawler, Infoseek, Excite, Thunderstone, AltaVista, GoTo, Yahoo

5.7.3 Kiểu Directory:

5.8 Phần mềm search engine: Một số nhà sản xuất có viết phần mềm để hổ trợ cho việc tìm kiếm thông tin trên Internet các phần mềm này có thể được bán (từ 25.00 USD trở lên) hay cho miển phí tiêu biểu là:

Kì tới: Dùng search engine theo lời khuyên cuả các chyên gia và phân tích kỹ năng

© http://vietsciences.free.fr Võ Quang Nhân

 

`