Internet信息資源及其檢索.ppt
《Internet信息資源及其檢索.ppt》由會員分享,可在線閱讀,更多相關(guān)《Internet信息資源及其檢索.ppt(69頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
第三章Internet信息資源及其檢索,,第一節(jié)Internet信息資源檢索,一、Internet信息資源信息源豐富信息內(nèi)容多樣性信息表現(xiàn)形式多樣化信息時效性信息交互性信息關(guān)聯(lián)性信息開放性免費(fèi)信息資源豐富信息組織的局部有序性與整體無序性,二、Internet信息資源種類1、按信息來源劃分政府信息資源,公眾信息資源,商用信息資源2、按信息時效劃分電子郵件型信息資源,圖書館目錄資源,書目與索引資源,全文資料及電子出版物資源,數(shù)據(jù)庫信息資源,3、按所采用的網(wǎng)絡(luò)傳輸協(xié)議可分為:,WWW網(wǎng)絡(luò)資源:因特網(wǎng)信息資源的主流,它使用http協(xié)議,使用簡單,功能強(qiáng)大,能方便迅速的瀏覽和傳遞分布于網(wǎng)絡(luò)各處的文字、圖象、聲音和多媒體超文本信息。FTP信息資源:它使用ftp協(xié)議,該協(xié)議主要用于連網(wǎng)計(jì)算機(jī)之間傳輸文件。FTP相當(dāng)于在網(wǎng)絡(luò)上兩個主機(jī)之間復(fù)制文件。目前仍是發(fā)布、傳遞軟件和文件的主要方法。TELNET信息資源:telnet是遠(yuǎn)程登陸協(xié)議。telnet信息資源包括硬件資源和軟件資源。許多機(jī)構(gòu)都提供遠(yuǎn)程登錄的信息系統(tǒng),如圖書館的公共目錄系統(tǒng),信息服務(wù)機(jī)構(gòu)的綜合信息系統(tǒng)等。用戶服務(wù)組資源:包括新聞組,電子郵件組等。這些電子通信組形式所傳遞和交流的信息資源是網(wǎng)絡(luò)上最自由、最具有開放性的資源。news,第二節(jié)搜索引擎及其使用,搜索引擎(searchengines)是www環(huán)境下一種信息檢索的工具。它利用某種軟件(如網(wǎng)絡(luò)“蜘蛛”spiders)對互聯(lián)網(wǎng)上的信息進(jìn)行自動跟蹤和發(fā)掘,把收集到的所有網(wǎng)頁進(jìn)行分類存儲和標(biāo)引,并向用戶提供查詢?nèi)肟凇S脩敉ㄟ^這個查詢?nèi)肟谠诤迫鐭熀5男畔⒑Q笾姓业阶约核璧男畔ⅰ?搜索引擎主要任務(wù),?信息搜集?信息處理?信息查詢,搜索引擎分類,1、目錄式搜索引擎2、搜索式搜索引擎(1)綜合搜索引擎(2)專業(yè)搜索引擎3、元搜索引擎,目錄式,目錄式搜索引擎是指把因特網(wǎng)中的資源服務(wù)器的地址收集起來,由其提供的資源的類型不同而分成不同的目錄,再一層層地進(jìn)行分類,形成可供瀏覽的樹狀結(jié)構(gòu),類似圖書館的分類主題目錄,用戶可以不進(jìn)行關(guān)鍵詞查詢,通過層層點(diǎn)擊瀏覽也可以找到所需要的信息。目錄索引類搜索引擎以Yahoo雅虎為代表,國內(nèi)還有搜狐、新浪、網(wǎng)易等,國外有OpenDirectoryProject(DMOZ)、LookSmart、About等。其特點(diǎn)是由于加入了人的智能,所以信息準(zhǔn)確、查準(zhǔn)率高,但是搜索范圍較小,查全率低,在檢索學(xué)科專業(yè)屬性特征明顯的信息時利用這種方式極為方便,但搜索引擎信息歸類的質(zhì)量和用戶對信息類別了解程度將直接影響到查詢結(jié)果。,,搜索(網(wǎng)頁)型,搜索(網(wǎng)頁)型搜索引擎是最常見的。指能夠?qū)Ω骶W(wǎng)站的每個網(wǎng)頁中的每個詞進(jìn)行搜索的引擎,使用關(guān)鍵詞(Keywords)匹配方式檢索。用戶使用關(guān)鍵詞對網(wǎng)頁進(jìn)行搜索時,系統(tǒng)通過蜘蛛機(jī)器人自動在選定范圍內(nèi)進(jìn)行檢索,并將所檢索到的信息自動標(biāo)引導(dǎo)入索引數(shù)據(jù)庫中,匹配所檢索中的網(wǎng)頁,并輸出匹配結(jié)果。有代表性的如Google、百度、AltaVista、AllTheWeb等。,搜索引擎:水平門戶_綜合搜索引擎[中文],中文常用搜索引擎百度中文搜索引擎:,搜索引擎:水平門戶_綜合搜索引擎[英文],國外英文常用搜索引擎Google—以搜索精度高、速度快成為最受歡迎的搜索引擎,是目前搜索界的領(lǐng)軍人物。Fast/AllTheWeb—總部位于挪威的搜索引擎后起之秀,風(fēng)頭直逼google。AltaVista—曾經(jīng)的搜索引擎巨人,目前仍被認(rèn)為是最好的搜索引擎之一。Overture—最著名的搜索引擎廣告商,競價(jià)排名的始作俑者,也是全文搜索引擎。Lycos—發(fā)源于西班牙的搜索引擎,網(wǎng)絡(luò)遍布世界各地。HotBot—隸屬于LycosNetworks,搜索結(jié)果來自其他搜索引擎及目錄索引。,搜索引擎:垂直搜索引擎——專業(yè)搜索引擎,垂直搜索引擎:即專業(yè)或?qū)S盟阉饕?,它專門用來檢索某一主題范圍或某一類型信息,追求專業(yè)性與服務(wù)深度是它的特點(diǎn)。垂直搜索引擎不但可保證此領(lǐng)域信息的收錄齊全與更新及時,而且檢索深度和分類細(xì)化遠(yuǎn)遠(yuǎn)優(yōu)于綜合搜索引擎。垂直搜索引擎的檢出結(jié)果雖可能較綜合搜索引擎少,但檢出結(jié)果重復(fù)率低、相關(guān)性強(qiáng)、查準(zhǔn)率高,適合于滿足較具體的、針對性強(qiáng)的檢索要求。目前已經(jīng)涉及到購物,旅游,汽車,工作,房產(chǎn),交友等行業(yè)。,垂直搜索引擎舉例:1,找工作的搜索引擎:google學(xué)術(shù)搜索:google圖書搜索:比價(jià)購物搜索引擎:博客與RSS搜索引擎:人脈搜索引擎:論壇搜索引擎:,垂直搜索引擎舉例:2,TheMusicFinderhttp://www.music-Singingfish(只能搜尋聲音和錄像)旅行TripAdvisor圖像搜索引擎:Business生意定向搜索引擎。DailyStocks可以了解被查詢公司存貨的信息已經(jīng)相關(guān)的新聞報(bào)導(dǎo),研究,引述和其他數(shù)據(jù)。FMLX英國定向的關(guān)于公司,存貨數(shù)據(jù),分析和研究的搜索引擎。eBizSearchhttp://www.ebizsearch.org關(guān)于電子商務(wù)的文章和報(bào)告。,RSS源[RSSfeed]搜索引擎,單個站點(diǎn):新華網(wǎng):八方搜索引擎博客中國看天下看天下搜索引擎:RSSSearchEngine周博通RSS導(dǎo)航,綜合搜索引擎的專門化趨勢:,GOOGLE學(xué)術(shù)搜索:AllTheWeb[能專門對圖像、多媒體信息。]搜狗(Sogou)[人物、音樂、購物、圖片、地圖],FTP資源搜索引擎,天網(wǎng)星空搜索,郵件列表搜索引擎,萬維網(wǎng)聯(lián)盟郵件列表檢索服務(wù)http://www.w3.org/search/mail/publicCatalist,BT搜索引擎,BT特工,元搜索引擎(MetaSearchEngine),這類搜索引擎沒有自己的索引數(shù)據(jù),它將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。如萬緯搜索、Search、Dogpile等優(yōu)點(diǎn):能同時搜索多個搜索引擎,能在一定程度上提高查詢的廣度。缺點(diǎn):因?yàn)橛袝r候并不能對一個搜索引擎全部查完,有時后也會漏掉一些重要信息。,早期的中文元搜索引擎1、metaFisher中文元搜索引擎2、萬緯搜索3、多元搜索1、一家搜2、bbmao是國內(nèi)唯一具有自動聚類功能的元搜索引擎,技術(shù)和功能上都比較強(qiáng)3、狠搜,更多元搜索引擎(英文),MetaCrawler()Profusion()Mamma()Dogpile()Vivisimo()Search(,,,,常用的一些搜索引擎網(wǎng)址(一),雅虎是中國最著名的目錄索引,是搜索引擎開山鼻祖之一。它收錄了全球資訊網(wǎng)上數(shù)以萬計(jì)的中文網(wǎng)站,不論你要找的網(wǎng)站是用國標(biāo)碼簡體字、大五碼繁體字還是圖形中文,都可以在這里找到。1999年9月,?檢索途徑通過分類目錄、關(guān)鍵詞檢索?檢索方法與技巧支持布爾邏輯檢索(不支持“OR”)、可以使用引號,強(qiáng)調(diào)“+”、“-”、指定關(guān)鍵字出現(xiàn)的段落(加t:、加u:),?檢索結(jié)果根據(jù)關(guān)聯(lián)程度排序同時列出“相關(guān)。。?!?其它與Google合作,常用的一些搜索引擎網(wǎng)址(二),1998年創(chuàng)立,搜狐“分類與搜索”已收錄網(wǎng)站四十多萬,已形成龐大的中文網(wǎng)站數(shù)據(jù)庫。搜狐的目錄導(dǎo)航式搜索引擎完全是由人工加工而成,相比機(jī)器人加工的搜索引擎來講具有很高的精確性、系統(tǒng)性和科學(xué)性。,?檢索途徑通過分類目錄、關(guān)鍵詞檢索?檢索方法與技巧支持布爾邏輯檢索、“-”、“&”、“/”、“()”、空格,?檢索結(jié)果根據(jù)關(guān)聯(lián)程度排序返回五種分類結(jié)果?其它直通車搜狐黃頁,常用的一些搜索引擎網(wǎng)址(三),1997年,(簡體中文)提供有類目檢索和網(wǎng)站檢索兩種方式。支持AND和“-”等條件查詢。以搜索精度高、速度快成為最受歡迎的搜索引索,是目前搜索的領(lǐng)軍人物。,?檢索方法與技巧模塊分類、關(guān)鍵詞檢索支持布爾邏輯檢索(自動添加AND),“OR”,“-”,?檢索特色網(wǎng)頁快照、手氣不錯相似網(wǎng)頁、查詢電話號碼、查找PDF文件、股票報(bào)價(jià)、查找字典釋意、用Google查找地圖、工具條服務(wù)、網(wǎng)頁翻譯、單詞糾錯、繁簡轉(zhuǎn)換使用偏好,Google搜索高級語法,基本:Booleanoperator(AND、OR、NOT)高級:“…”define:site:filetype:inurl:intitle:fy罕用:info:link:related:cache:,Booleanoperator,AANDB:,Booleanoperator,AORB:,,,Booleanoperator,ANOTB:,語法“…”全文搜索,,,語法define:——定義,語法filetype:——查特定文件類型,.ppt.pdf.ps.doc.txt.xls,.swf.rtf.lwp.mw.wri.ans.wdb,,,語法site:(指定網(wǎng)域查找),.org,.aero.biz.coop.info.museum.name.pro,,,語法fy——中英文詞典翻譯,語法“l(fā)ink:”(友情鏈接),語法inurl:intitle:,網(wǎng)址中搜索網(wǎng)頁標(biāo)題中搜索,語法Info:(查詢與某鏈接相關(guān)信息),語法“cache:”——查緩存頁面,用來搜索google服務(wù)器上某頁面的緩存,通常用于查找某些已經(jīng)被刪除的死鏈接網(wǎng)頁,相當(dāng)于使用普通搜索結(jié)果頁面中的“網(wǎng)頁快照”功能。示例:查找google緩存的中文yahoo首頁搜索:“cache:”,?檢索方法與技巧模塊分類、關(guān)鍵詞檢索要求“一字不差”,支持布爾邏輯檢索(可以用空格代替AND/+)可以使用檢索語法,?檢索特色百度快照、自動糾錯、百度搜霸使用偏好,百度與google比較,搜索英文不必說用google,搜索中文呢?很多人并不了解它們更新的情況,google發(fā)展早,因而它貯存了大量舊的信息,百度發(fā)展遲,信息較新。更新速度:對中文google一般半月至一月一更新,而且僅搜索到三級鏈接,三級以下便不在搜索,那么我如何看到最新的google搜索的結(jié)果呢?這個站點(diǎn):,百度和google語法的應(yīng)用,找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT這些文件名都是網(wǎng)友想找的重點(diǎn),至于各是什么類型文件,請上網(wǎng)查一下便知道了,這里不多說了。尤其老板讓你做個powerpoint,找不到圖怎么辦?用google去搜索。,方法是利用語法filetype:后綴名。如找PDF文件,在正常關(guān)鍵詞后面加filetype:PDF即可,搜索結(jié)果全是PDF文件。找特定題目的網(wǎng)頁語法intitle:網(wǎng)站查找友情鏈接:"link:"(英文單字link后加冒號)用于搜索鏈接到某個URL地址的網(wǎng)頁??梢粤私庥心男┚W(wǎng)頁把鏈接指向您的網(wǎng)頁。,基本搜索語法——查找文件,查找特定站點(diǎn):site:www.*.com如釣魚島site:但不可加入http://或/這類,否則是錯的。查找美國教育網(wǎng)上的宇宙大爆炸jpg圖片搜索:“BIGBANGfiletype:jpgsite:edu”結(jié)果:搜索有關(guān)BIGBANGfiletype:jpgsite:edu的圖片,基本搜索語法——查找站點(diǎn),Site可將搜索定位于某一個域名上,有利于縮小搜索范圍,提高搜索效率。如keywordssite:edu,效果很好!可以方便地搜索到各大學(xué)內(nèi)有用的資源。site:tw,site:edu.tw,site:.......這是定位于國家或地區(qū),將搜索局限于某些國家或地區(qū),或加上edu,則是這些國家或地區(qū)的大學(xué),效果自然更好。如果site:則搜索國內(nèi)醫(yī)科大學(xué)內(nèi)的資源(會漏綜合性大學(xué)的資源的,要慎用)。,特殊語法:inurl,“inurl”語法返回的網(wǎng)頁鏈接中包含第一個關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁文檔中。有很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁名稱中,比如“MP3”、“GALLERY”等,于是,就可以用INURL語法找到這些相關(guān)資源鏈接,然后,用第二個關(guān)鍵詞確定是否有某項(xiàng)具體資料。,INURL語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。示例:查找MIDI曲“滄海一聲笑”。搜索:“inurl:midi滄海一聲笑”結(jié)果:已搜索有關(guān)inurl:midi滄海一聲笑的中文(簡體)網(wǎng)頁。,注意:“inurl:”后面不能有空格,GOOGLE也不對URL符號如“/”進(jìn)行搜索。例如,GOOGLE會把“cgi-bin/phf”中的“/”當(dāng)成空格處理。,google其它功能——查縮略詞的全稱,利用google查縮略詞的全稱,如果寫作時突然忘了某個縮略詞的全稱,當(dāng)時手頭若有金山詞霸等軟件則是易事,若無可考慮使用google,將其中文名與其縮略名作為關(guān)鍵詞搜索,效果很好,如:不知道血管活性腸肽(VIP)的全稱,可在google中輸入血管活性腸肽VIP,google其它功能——查英文單詞的中文名稱,google是最全的英中詞典,你找到一個英文詞,卻不知中文怎么辦?用google,寫出英文詞,然后大概了解一下這個詞屬于哪一個學(xué)科,再用加用一個中文關(guān)鍵詞搜索一下,效果很好。如urotensin不知道中文意思,但知道它是收縮血管的藥物,這時用urotensin血管收縮查一下,可能會出現(xiàn)一些文章或綜述內(nèi),其中便附有這個詞的中文了,google其它功能——搜索電話,如果想知道某個公司的電話,往往許多人喜歡這樣選關(guān)鍵詞:公司名稱tel,結(jié)果得到的根本不是你需要的。如果你知道這個公司的性質(zhì)或?qū)儆谑裁吹胤降?,則可以這樣搜索:區(qū)號公司名,這比上述關(guān)鍵詞要有效得多,這也涉及到搜索效率的問題。,搜索引擎的查詢技巧,?分析研究對象,選用搜索引擎?確定搜索途徑,使用不同方式?正確選用搜索引擎的搜索選項(xiàng)?正確選用搜索引擎的各項(xiàng)搜索功能,?根據(jù)反饋,修改檢索1、縮小搜索范圍:利用二次搜索(重新查詢、在結(jié)果中再查、在結(jié)果中去除)、使用檢索語法構(gòu)造恰當(dāng)?shù)臋z索表達(dá)式、選用正確的關(guān)鍵詞2、擴(kuò)大搜索范圍:使用同義詞或近義詞、使用檢索語法or和截詞檢索、使用多個搜索引擎和元搜索引擎,如何提高查全率?,選擇上位詞和相關(guān)詞;如:查找關(guān)于孫中山的文獻(xiàn),先用孫中山查,再用孫文、國父查找。調(diào)節(jié)檢索式的網(wǎng)羅度,刪除不必要的組面,如and(并且);進(jìn)行族性檢索(分類檢索或用or連接相關(guān)檢索詞);截詞檢索;com*代替computer增加檢索途徑。,如何提高查準(zhǔn)率?,提高專指度(用下位詞或換專指性強(qiáng)的自由詞)用邏輯乘“*”(and)或not相關(guān)檢索項(xiàng);如查找克林頓,但不要關(guān)于萊溫斯基的信息。檢索式:克林頓not萊溫斯基用文獻(xiàn)外部特征限制輸出結(jié)果(在中文圖書中查找);用“二次檢索”、“條件檢索”排除誤檢;限制檢索字段,指定鄰接和優(yōu)先關(guān)系。,,,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- Internet 信息資源 及其 檢索
鏈接地址:http://appdesigncorp.com/p-11496642.html