《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章

上傳人:嘀****l 文檔編號(hào):248192017 上傳時(shí)間:2024-10-22 格式:PPT 頁數(shù):49 大?。?.41MB
收藏 版權(quán)申訴 舉報(bào) 下載
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章_第1頁
第1頁 / 共49頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章_第2頁
第2頁 / 共49頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章_第3頁
第3頁 / 共49頁

下載文檔到電腦,查找使用更方便

12 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章》由會(huì)員分享,可在線閱讀,更多相關(guān)《《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》(演示稿)第5章(49頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,第5章數(shù)據(jù)倉庫系統(tǒng)的實(shí)施,SQL Server 2000數(shù)據(jù)倉庫設(shè)計(jì)與使用,其他一些公司的數(shù)據(jù)倉庫實(shí)施戰(zhàn)略,數(shù)據(jù)倉庫的投資回

2、報(bào)分析,1,SQL Server 2000 的基本服務(wù),SQL Server 2000 關(guān)系數(shù)據(jù)庫引擎:是一個(gè)流行的、具有高度可伸縮性和高度可靠性的數(shù)據(jù)存儲(chǔ)引擎。該數(shù)據(jù)庫引擎將數(shù)據(jù)存儲(chǔ)在表中。每個(gè)表上都列出感興趣的一些對(duì)象,每個(gè)表上的列表示由表建模的對(duì)象的屬性,而表上的行則代表由表建模的這種對(duì)象的事例。應(yīng)用程序可以將結(jié)構(gòu)化查詢語言(SQL)的語句提交給數(shù)據(jù)庫引擎,后者將表格格式的結(jié)果集返回給應(yīng)用程序。SQL Server 支持的特定 SQL 語言稱為 Transact-SQL。應(yīng)用程序還可以提交 SQL 語句或 XPath 查詢,并請(qǐng)求數(shù)據(jù)庫引擎以 XML文檔形式返回結(jié)果。,關(guān)系數(shù)據(jù)庫引擎具有

3、高度的可伸縮性。SQL Server 2000 企業(yè)版可以支持多組數(shù)據(jù)庫服務(wù)器相互協(xié)作,構(gòu)成可供上千用戶同時(shí)訪問的 TB 大小的數(shù)據(jù)庫。該引擎能夠處理世界上任何 Web 站點(diǎn)的流量。該數(shù)據(jù)庫引擎還能自我調(diào)節(jié),自動(dòng)在連接到數(shù)據(jù)庫的用戶增多時(shí)獲取資源,并在用戶注銷后釋放資源。,2,SQL Server 2000 的基本服務(wù),關(guān)系數(shù)據(jù)庫引擎具有高可靠性。在數(shù)據(jù)庫引擎的早期版本中要求停止和啟動(dòng)的管理操作現(xiàn)在可以在引擎運(yùn)行當(dāng)中執(zhí)行,從而增加了可用性。數(shù)據(jù)庫引擎與 Windows 2000 和 Windows NT 故障轉(zhuǎn)移群集的集成可定義虛擬服務(wù)器,即使節(jié)點(diǎn)中的一臺(tái)物理服務(wù)器出現(xiàn)故障,這些虛擬服務(wù)器仍然

4、保持運(yùn)行。在適當(dāng)?shù)牡胤剑罩緜魉涂梢杂糜诰S護(hù)熱備用服務(wù)器。在故障發(fā)生的數(shù)分鐘內(nèi),熱備用服務(wù)器可以代替生產(chǎn)服務(wù)器運(yùn)行。,關(guān)系數(shù)據(jù)庫引擎具有高度的安全性。登錄身份驗(yàn)證可以與 Windows 身份驗(yàn)證集成在一起,這樣,密碼將不會(huì)存儲(chǔ)在 SQL Server 中,也不會(huì)通過網(wǎng)絡(luò)發(fā)送而被網(wǎng)絡(luò)嗅探器讀取。網(wǎng)站可以設(shè)置 C2 級(jí)審核,對(duì)所有訪問數(shù)據(jù)庫的用戶進(jìn)行審核,還可以使用安全套接字層(SSL)加密的辦法,對(duì)所有在應(yīng)用程序和數(shù)據(jù)庫間傳送的數(shù)據(jù)進(jìn)行加密。,3,SQL Server 2000 的基本服務(wù),數(shù)據(jù)庫引擎的分布式查詢功能。可以訪問所有可通過 OLE DB 訪問的數(shù)據(jù)源中的數(shù)據(jù)。在 Transact-

5、SQL 語句中,可以像引用實(shí)際駐留在 SQL Server 數(shù)據(jù)庫中的表一樣引用遠(yuǎn)程 OLE DB 數(shù)據(jù)源表。此外,全文檢索功能可以對(duì) SQL Server 數(shù)據(jù)庫或 Windows 文件中存儲(chǔ)的文本數(shù)據(jù)進(jìn)行復(fù)雜的模式匹配。,關(guān)系數(shù)據(jù)庫引擎能夠存儲(chǔ)由頂層聯(lián)機(jī)事務(wù)處理(OLTP)系統(tǒng)生成的所有事務(wù)的詳細(xì)記錄。該數(shù)據(jù)庫引擎還可以支持最大的聯(lián)機(jī)分析(OLAP)數(shù)據(jù)倉庫中的事實(shí)數(shù)據(jù)表和維度表的嚴(yán)格處理要求。,Microsoft SQL Server 2000 Analysis Services 提供分析數(shù)據(jù)倉庫和數(shù)據(jù)集市中存儲(chǔ)的數(shù)據(jù)的工具。Analysis Services 以多維數(shù)據(jù)集的形式顯示事實(shí)

6、數(shù)據(jù)表和維度表中的數(shù)據(jù),從多維數(shù)據(jù)集中可以分析趨勢(shì)和其它對(duì)于規(guī)劃今后工作非常重要的信息。在 Analysis Services 多維數(shù)據(jù)集上處理 OLAP 查詢比試圖在 OLTP 數(shù)據(jù)庫中記錄的詳細(xì)數(shù)據(jù)上進(jìn)行同樣的查詢要快得多。,4,SQL Server 2000的特性,Internet 集成:SQL Server 2000 數(shù)據(jù)庫引擎提供完整的 XML 支持。它還具有構(gòu)成最大的 Web 站點(diǎn)的數(shù)據(jù)存儲(chǔ)組件所需的可伸縮性、可用性和安全功能。其程序設(shè)計(jì)模型與 Windows DNA 構(gòu)架集成,用以開發(fā) Web 應(yīng)用程序,并且還支持 English Query 和 Microsoft 搜索服務(wù)等功

7、能,在 Web 應(yīng)用程序中包含了用戶友好的查詢和強(qiáng)大的搜索功能。,可伸縮性和可用性:同一個(gè)數(shù)據(jù)庫引擎可以在不同的平臺(tái)上使用。SQL Server 2000 企業(yè)版支持聯(lián)合服務(wù)器、索引視圖和大型內(nèi)存支持等功能,使其得以升級(jí)到最大 Web 站點(diǎn)所需的性能級(jí)別。,企業(yè)級(jí)數(shù)據(jù)庫功能:SQL Server 2000 關(guān)系數(shù)據(jù)庫引擎能充分保護(hù)數(shù)據(jù)完整性,同時(shí)將管理上千個(gè)并發(fā)修改數(shù)據(jù)庫的用戶的開銷減到最小。其分布式查詢得以引用來自不同數(shù)據(jù)源的數(shù)據(jù),就好象這些數(shù)據(jù)是 SQL Server 2000 數(shù)據(jù)庫的一部分,同時(shí)分布式事務(wù)支持充分保護(hù)任何分布式數(shù)據(jù)更新的完整性。復(fù)制功能可維護(hù)多個(gè)數(shù)據(jù)復(fù)本,同時(shí)確保單獨(dú)的

8、數(shù)據(jù)復(fù)本保持同步。,5,SQL Server 2000的特性,易于安裝、部署和使用:SQL Server 2000 中包括一系列管理和開發(fā)工具,這些工具可改進(jìn)在多個(gè)站點(diǎn)上安裝、部署、管理和使用 SQL Server 的過程。SQL Server 2000 還支持基于標(biāo)準(zhǔn)的、與 Windows DNA 集成的程序設(shè)計(jì)模型,使 SQL Server 數(shù)據(jù)庫和數(shù)據(jù)倉庫的使用成為生成強(qiáng)大的可伸縮系統(tǒng)的無縫部分。這些功能可以快速交付 SQL Server 應(yīng)用程序,使客戶只需最少的安裝和管理開銷即可實(shí)現(xiàn)這些應(yīng)用程序。,數(shù)據(jù)倉庫:SQL Server 2000 中包括析取和分析匯總數(shù)據(jù)以進(jìn)行聯(lián)機(jī)分析處理(

9、OLAP)的工具。SQL Server 中還包括一些工具,可用來直觀地設(shè)計(jì)數(shù)據(jù)庫并通過 English Query 來分析數(shù)據(jù)。,6,SQL Server 2000 組件關(guān)系圖,7,SQL Server 2000數(shù)據(jù)倉庫工具,工具,描述,關(guān)系數(shù)據(jù)庫,數(shù)據(jù)倉庫設(shè)計(jì)、構(gòu)造、維護(hù)的基礎(chǔ),數(shù)據(jù)轉(zhuǎn)換服務(wù)(DTS),用于向數(shù)據(jù)倉庫加載數(shù)據(jù),數(shù)據(jù)復(fù)制,用于分布式數(shù)據(jù)倉庫數(shù)據(jù)分布和加載數(shù)據(jù),OLE DB,提供應(yīng)用程序與數(shù)據(jù)源的接口API,Analysis Services,用于采集和分析數(shù)據(jù)倉庫中的數(shù)據(jù),English Query,提供使用英語查詢數(shù)據(jù)倉庫,Meta Data Services,瀏覽數(shù)據(jù)倉庫中

10、的元數(shù)據(jù),PivotTable服務(wù),用于制定操作多維數(shù)據(jù)的客戶端接口,8,關(guān)系型數(shù)據(jù)庫,關(guān)系型數(shù)據(jù)庫是設(shè)計(jì)、構(gòu)造、維護(hù)數(shù)據(jù)倉庫的基礎(chǔ)技術(shù)。,Microsoft SQL Server 2000是一個(gè)關(guān)系型數(shù)據(jù)庫管理系統(tǒng),它提供了強(qiáng)大的數(shù)據(jù)庫引擎和許多工具,這些工具不僅可以用于數(shù)據(jù)庫的管理,而且可以用于數(shù)據(jù)倉庫的管理,是數(shù)據(jù)倉庫的技術(shù)基礎(chǔ)。,9,數(shù)據(jù)轉(zhuǎn)換服務(wù)(DTS),提供數(shù)據(jù)轉(zhuǎn)換功能,例如數(shù)據(jù)引入、引出以及在SQL Server和任何OLE DB、ODBC或者文本文件之間轉(zhuǎn)換數(shù)據(jù)。,利用DTS,通過交互式地或按照規(guī)劃自動(dòng)地從多處異構(gòu)數(shù)據(jù)源輸入數(shù)據(jù),這樣便有可能在SQL Server上建立數(shù)據(jù)倉庫

11、和數(shù)據(jù)市場(chǎng)。,數(shù)據(jù)的來源特性允許用戶輸入查詢數(shù)據(jù)的輸入時(shí)間、地點(diǎn)及其計(jì)算方法。數(shù)據(jù)的引入引出是通過以相同的格式讀寫數(shù)據(jù),在應(yīng)用程序之間交換數(shù)據(jù)的過程。一次轉(zhuǎn)換是指在源數(shù)據(jù)被存儲(chǔ)到目的地之前,對(duì)其進(jìn)行的一系列操作。,轉(zhuǎn)換特性使得載引入引出中完成復(fù)雜數(shù)據(jù)的驗(yàn)證、清除等功能變得非常簡單。定制轉(zhuǎn)換對(duì)象可以被創(chuàng)建并集成進(jìn)第三方產(chǎn)品中。,DTS支持多步封裝,其中大量文件能被單獨(dú)處理,最終被集成為一個(gè)單一的文件。在目的地,該文件的記錄能被系統(tǒng)分為多個(gè)記錄,或相反,多個(gè)記錄被集成為一個(gè)單一的記錄。,DTS也與微軟的中心庫集成在一起,微軟數(shù)據(jù)中心庫存儲(chǔ)元數(shù)據(jù)、數(shù)據(jù)傳送包和數(shù)據(jù)源特性,許多獨(dú)立的軟件經(jīng)銷商支持和共

12、享這個(gè)元數(shù)據(jù)模型。數(shù)據(jù)轉(zhuǎn)換服務(wù)可以在SQL Server間移動(dòng)數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)、觸發(fā)器、規(guī)則、默認(rèn)、約束和用戶定義的數(shù)據(jù)類型,只有數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)可以在不同的異構(gòu)數(shù)據(jù)源中間傳遞。,10,數(shù)據(jù)復(fù)制,數(shù)據(jù)復(fù)制:是一種實(shí)現(xiàn)數(shù)據(jù)分布的方法,就是指把一個(gè)系統(tǒng)中的數(shù)據(jù)通過網(wǎng)絡(luò)分布到另外一個(gè)或者多個(gè)地理位置不同的系統(tǒng)中,以適應(yīng)可伸縮組織的需要,減輕主服務(wù)器的工作負(fù)荷和提高數(shù)據(jù)的使用效率。,數(shù)據(jù)復(fù)制的過程類似于報(bào)紙雜志的出版過程,即把信息從信息源迅速傳送到信息接受處。出版服務(wù)器包含了將要復(fù)制的數(shù)據(jù)所在的數(shù)據(jù)庫,該服務(wù)器負(fù)責(zé)制作將要出版的數(shù)據(jù),然后將這些出版的數(shù)據(jù)的所有變化發(fā)送到分布服務(wù)器中。訂閱服務(wù)器是數(shù)據(jù)復(fù)制的

13、目標(biāo)地,負(fù)責(zé)接收復(fù)制過來的數(shù)據(jù),并且負(fù)責(zé)接收從出版服務(wù)器上傳送過來的全部變化。分布服務(wù)器在出版服務(wù)器和訂閱服務(wù)器之間起中介作用。分布服務(wù)器負(fù)責(zé)從出版服務(wù)器中接受復(fù)制過來的數(shù)據(jù),然后在該服務(wù)器上的分布數(shù)據(jù)庫中存儲(chǔ)這些變化,最后按照指定的時(shí)間間隔推向響應(yīng)的訂閱服務(wù)器。,在復(fù)制過程中,把將要復(fù)制的數(shù)據(jù)稱為出版物和文章。文章是復(fù)制的基本單元,是組成出版物的最小單位。文章與數(shù)據(jù)庫中的表對(duì)應(yīng)。文章既可以對(duì)應(yīng)一個(gè)表中的全部數(shù)據(jù),也可以指包括表中的一部分?jǐn)?shù)據(jù)。出版物是一個(gè)完整的將要復(fù)制的內(nèi)容,它包括一篇或多篇文章,是訂閱服務(wù)器訂閱的對(duì)象。,11,OLE DB,OLE DB式微軟開發(fā)的數(shù)據(jù)訪問編程界面。微軟已經(jīng)

14、定位OLE DB是ODBC繼承者,ODBC主要用于處理關(guān)系型數(shù)據(jù)。ODBC是基于SQL的,它可以很好的用于關(guān)系型數(shù)據(jù)庫訪問,但是它不能用于非關(guān)系型數(shù)據(jù)源。象ODBC一樣,OLE DB也提供對(duì)關(guān)系型數(shù)據(jù)的訪問,但是OLE DB擴(kuò)展了由ODBC提供的功能。,OLE DB的設(shè)計(jì)目的是用于所有數(shù)據(jù)類型的標(biāo)準(zhǔn)界面。除了關(guān)系型數(shù)據(jù)庫的訪問,OLE DB提供對(duì)各種各樣數(shù)據(jù)源的訪問,包括Excel電子表格的數(shù)據(jù),dBase的ISAM文件、電子郵件、新的NT的Active Directory和IBM的DB2數(shù)據(jù)。使用OLE DB,用一個(gè)界面就可以訪問許多不同的數(shù)據(jù)源。,OLE DB是微軟的數(shù)據(jù)訪問策略,稱為萬能

15、數(shù)據(jù)訪問的基礎(chǔ)。萬能數(shù)據(jù)訪問指的是一組通用界面,它用來表示來自任何數(shù)據(jù)源的數(shù)據(jù)。OLE DB是使萬能訪問成為現(xiàn)實(shí)的技術(shù)。萬能數(shù)據(jù)訪問和OLE DB的另一方面是所有的對(duì)象都應(yīng)該在數(shù)據(jù)庫中維護(hù),不是企圖把商業(yè)要求的不同的數(shù)據(jù)移動(dòng)到一個(gè)面向?qū)ο蟮臄?shù)據(jù)庫中。OLE DB創(chuàng)建和理解企業(yè)數(shù)據(jù)并且在各種數(shù)據(jù)源中維護(hù)。,12,Analysis Services,在數(shù)據(jù)倉庫或者數(shù)據(jù)市場(chǎng)中的信息可OLAP處理,OLAP可以有效的以維度和度量組成的立方體方式察看數(shù)據(jù)。維度是一種描述性分類,例如,維度可能是地理位置,也可能是產(chǎn)品類型。度量是一種定量數(shù)值,例如銷售額、庫存量或者總費(fèi)用。來自于原始數(shù)據(jù)源的合計(jì)存儲(chǔ)在每一個(gè)

16、立方體單元中,這種組織數(shù)據(jù)的方法可以輕易得過濾數(shù)據(jù)、有效的加快數(shù)據(jù)的查詢。然而,存在著這種問題:雖然OLAP合計(jì)是在數(shù)據(jù)倉庫中可以達(dá)到的查詢性能的關(guān)鍵因素,但是存儲(chǔ)這些合計(jì)數(shù)據(jù)的成本是磁盤存儲(chǔ)量。事實(shí)上,合計(jì)數(shù)據(jù)量可以輕易的超過原有的數(shù)據(jù)量。另外,當(dāng)維度和合計(jì)量提高時(shí),所要求的OLAP數(shù)據(jù)存儲(chǔ)量也大大的提高。這種對(duì)存儲(chǔ)量的極大要求一般稱為數(shù)據(jù)爆炸。OLAP描述的是一種多維數(shù)據(jù)服務(wù),這種服務(wù)的設(shè)計(jì)目的是保證分析員、經(jīng)理和決策者針對(duì)特定的問題,通過快速、一致、交互式的實(shí)時(shí)數(shù)據(jù)訪問和分析。,13,Analysis Services,MOLAP:多維型OLAP在一個(gè)用于壓縮索引的永久數(shù)據(jù)存儲(chǔ)中存儲(chǔ)維度數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)。合計(jì)存儲(chǔ)用來加快數(shù)據(jù)訪問。MOLAP查詢引擎是專有的,而且優(yōu)化成由MOLAP數(shù)據(jù)存儲(chǔ)使用的存儲(chǔ)格式。MOLAP提供了比ROLAP更快的查詢處理速度,并且要求更少的存儲(chǔ)空間。然而,它不能較好的伸縮,并且要求使用單獨(dú)的數(shù)據(jù)庫來存儲(chǔ)。,ROLAP:關(guān)系型OLAP在關(guān)系型數(shù)據(jù)表中存儲(chǔ)合計(jì)。ROLAP針對(duì)關(guān)系型數(shù)據(jù)庫的應(yīng)用允許其利用已有的數(shù)據(jù)庫資源,并且允許ROLAP應(yīng)用程序很好的伸縮。然而

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!