商業(yè)分析第5章商業(yè)信息的管理

上傳人:wux****ua 文檔編號(hào):22891406 上傳時(shí)間:2021-06-02 格式:PPT 頁(yè)數(shù):45 大小:4.04MB
收藏 版權(quán)申訴 舉報(bào) 下載
商業(yè)分析第5章商業(yè)信息的管理_第1頁(yè)
第1頁(yè) / 共45頁(yè)
商業(yè)分析第5章商業(yè)信息的管理_第2頁(yè)
第2頁(yè) / 共45頁(yè)
商業(yè)分析第5章商業(yè)信息的管理_第3頁(yè)
第3頁(yè) / 共45頁(yè)

下載文檔到電腦,查找使用更方便

9.9 積分

下載資源

還剩頁(yè)未讀,繼續(xù)閱讀

資源描述:

《商業(yè)分析第5章商業(yè)信息的管理》由會(huì)員分享,可在線閱讀,更多相關(guān)《商業(yè)分析第5章商業(yè)信息的管理(45頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、-商業(yè)數(shù)據(jù)的分析、挖掘和應(yīng)用華東師范大學(xué)出版社 數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)數(shù)據(jù)集市商業(yè)信息倉(cāng)儲(chǔ)設(shè)計(jì)商業(yè)智能 數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)庫(kù) 概念:數(shù)據(jù)庫(kù)(Database)是依照某種數(shù)據(jù)模型組織起來(lái)并存放二級(jí)存儲(chǔ)器中的數(shù)據(jù)集合。這種數(shù)據(jù)集合具有如下特點(diǎn):盡可能不重復(fù);以最優(yōu)方式為某個(gè)特定組織的多種應(yīng)用服務(wù);其數(shù)據(jù)結(jié)構(gòu)獨(dú)立于使用它的應(yīng)用程序;對(duì)數(shù)據(jù)的增、刪、改和檢索由統(tǒng)一軟件進(jìn)行管理和控制。從發(fā)展的歷史看,數(shù)據(jù)庫(kù)由文件管理系統(tǒng)發(fā)展起來(lái)的,它是數(shù)據(jù)管理的高級(jí)階段。 數(shù)據(jù)庫(kù)建設(shè)的必要性: 1.劣質(zhì)信息要付出成本 2.難以辨別企業(yè)最有價(jià)值的客戶 3.由于不準(zhǔn)確的單據(jù),難以對(duì)收入進(jìn)行追蹤 4.優(yōu)質(zhì)信息將帶來(lái)

2、明顯的好處 數(shù)據(jù)庫(kù)管理系統(tǒng) 數(shù)據(jù)庫(kù)管理系統(tǒng)之于數(shù)據(jù)庫(kù),就如同文字處理軟件之于文件,或電子表格軟件之于電子表格。一個(gè)是信息,而另一個(gè)是人們用來(lái)操作這些信息的軟件。數(shù)據(jù)庫(kù)管理系統(tǒng)層次數(shù)據(jù)庫(kù)模型網(wǎng)狀數(shù)據(jù)庫(kù)模型關(guān)系數(shù)據(jù)庫(kù)模型 優(yōu)勢(shì)更高的靈活性和性能更少的數(shù)據(jù)冗余和錯(cuò)誤更高的安全性 數(shù)據(jù)倉(cāng)庫(kù) 概念: 1990年比爾恩門(Bill Inmon)提出了數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)的概念。數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的(Subject Oriented)、集成的(Integrate)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策。面向主題(

3、Subject Oriented)集成(Integrate)相對(duì)穩(wěn)定(Non-Volatile)反映歷史變化(Time Variant) 傳統(tǒng)數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)決策處理中的系統(tǒng)響應(yīng)問(wèn)題決策數(shù)據(jù)需求的問(wèn)題決策數(shù)據(jù)操作的問(wèn)題 數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別面向事務(wù)設(shè)計(jì)存儲(chǔ)實(shí)時(shí)數(shù)據(jù)采用符合范式的規(guī)則來(lái)設(shè)計(jì)(盡量避免冗 余)數(shù)據(jù)庫(kù)面向主題設(shè)計(jì)存儲(chǔ)歷史數(shù)據(jù)采用反范式的方式來(lái)設(shè)計(jì)(有意引入冗余)數(shù)據(jù)倉(cāng)庫(kù)從數(shù)據(jù)量來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)要比數(shù)據(jù)庫(kù)更龐大得多在為應(yīng)用服務(wù)的過(guò)程中,數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)往往要結(jié)合使用。 5.2.1 相關(guān)概念1. 三層結(jié)構(gòu) 三層體系結(jié)構(gòu),是在客戶端與數(shù)據(jù)庫(kù)之間加入了一個(gè)中間層。三層體系結(jié)構(gòu)的應(yīng)用程序?qū)I(yè)務(wù)

4、規(guī)則、數(shù)據(jù)訪問(wèn)、合法性校驗(yàn)等工作放到了中間層進(jìn)行處理。通常情況下,客戶端不直接與數(shù)據(jù)庫(kù)進(jìn)行交互,而是通過(guò)與中間層通訊建立連接,再經(jīng)由中間層與數(shù)據(jù)庫(kù)進(jìn)行交互。 )表示層(Browser)中間層(WebServer)數(shù)據(jù)層 (DBServer) 表示層位于客戶端,一般沒(méi)有應(yīng)用程序,借助于Javaapplet、Actives、Javascript、vbscript等技術(shù)可以處理一些簡(jiǎn)單的客戶端處理邏輯。 中間層是用戶服務(wù)和數(shù)據(jù)服務(wù)的邏輯橋梁。它負(fù)責(zé)接受遠(yuǎn)程或異地的用戶請(qǐng)求,對(duì)用戶身份和數(shù)據(jù)庫(kù)存取權(quán)限進(jìn)行驗(yàn)證,運(yùn)用服務(wù)器腳本,借助于中間件把請(qǐng)求發(fā)送到數(shù)據(jù)庫(kù)服務(wù)器(即數(shù)據(jù)層),把數(shù)據(jù)庫(kù)服務(wù)器返回的數(shù)據(jù)經(jīng)

5、過(guò)邏輯處理并轉(zhuǎn)換成HTML及各種腳本傳回客戶端。 數(shù)據(jù)層位于最底層,它負(fù)責(zé)管理數(shù)據(jù)庫(kù),接受Web服務(wù)器對(duì)數(shù)據(jù)庫(kù)操縱的請(qǐng)求,實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)查詢、修改、更新等功能及相關(guān)服務(wù),并把結(jié)果數(shù)據(jù)提交給Web服務(wù)器。 2. 三級(jí)模型和二層映射l 數(shù)據(jù)庫(kù)的設(shè)計(jì)有一個(gè)嚴(yán)謹(jǐn)?shù)捏w系結(jié)構(gòu),即:三級(jí)模式,它包括外模式、概念模式、內(nèi)模式。三級(jí)模式有效地組織、管理數(shù)據(jù),提高了數(shù)據(jù)庫(kù)的邏輯獨(dú)立性和物理獨(dú)立性。l 數(shù)據(jù)庫(kù)管理系統(tǒng)在這三級(jí)模式之間提供那個(gè)了兩層映像:外模式/模式映像,模式/內(nèi)模式映像。 數(shù)據(jù)倉(cāng)庫(kù)的生成05 數(shù)據(jù)字典和元數(shù)據(jù)06 物理模型設(shè)計(jì)04總體分析設(shè)計(jì)01 邏輯模型設(shè)計(jì)03 概念模型設(shè)計(jì)02 1. 總體分析設(shè)計(jì)

6、 確定研究?jī)?nèi)容 這一環(huán)節(jié)主要是明確要研究的內(nèi)容,即要研究的問(wèn)題,圍繞該問(wèn)題所需要的數(shù)據(jù)和信息及如何獲得這些信息等方面問(wèn)題進(jìn)行研究。 確定主題 這一步中,需要根據(jù)所研究的內(nèi)容確定相應(yīng)的主題,并盡可能明確主題之間的關(guān)系。 以企業(yè)為例,當(dāng)企業(yè)在選擇促銷商品的時(shí)候,它可能考慮的主題包括:商品、顧客、供應(yīng)商。 其中商品主題包含商品編號(hào)、商品名稱、價(jià)格、庫(kù)存、產(chǎn)品、顏色、大小等;顧客主題包含顧客編號(hào)、年齡、姓名、性別、職業(yè)等;供應(yīng)商主題包含供應(yīng)商編號(hào)、供應(yīng)商所在地、供應(yīng)商品編號(hào)、供應(yīng)商品名稱等。 在這三個(gè)主題中,一個(gè)供應(yīng)商可以供應(yīng)多種商品,一種商品可以由多個(gè)供應(yīng)商供應(yīng),供應(yīng)商主題和商品主題之間的聯(lián)系就是商

7、品供應(yīng)關(guān)系;一位顧客可以買多種商品,一種商品可以被多個(gè)顧客購(gòu)買,商品主題和顧客主題之間的聯(lián)系是購(gòu)買關(guān)系;顧客主題和供應(yīng)商主題之間沒(méi)有 直接關(guān)系,它們之間的關(guān)系是通過(guò)商品來(lái)實(shí)現(xiàn)的。 技術(shù)環(huán)境準(zhǔn)備在這一階段,一般包括兩個(gè)步驟:a) 要根據(jù)要處理的問(wèn)題來(lái)確定數(shù)據(jù)倉(cāng)庫(kù)的各項(xiàng)性能指標(biāo)。一般情況下,需要在這一步里確定的性能指標(biāo)包括: 管理大數(shù)據(jù)量的能力; 進(jìn)行靈活數(shù)據(jù)存取的能力; 根據(jù)數(shù)據(jù)模型重組數(shù)據(jù)的能力; 數(shù)據(jù)發(fā)送和接收的能力; 周期性成批裝載數(shù)據(jù)的能力; 可設(shè)定完成時(shí)間的作業(yè)管理能力。 b) 要根據(jù)上面的各項(xiàng)性能指標(biāo)來(lái)確定相應(yīng)的軟硬件配置。 2.概念模型設(shè)計(jì)l 將總體分析設(shè)計(jì)中得到的用戶需求抽象為計(jì)

8、算機(jī)表示的信息結(jié)構(gòu),即概念模型。它是從客觀世界(用戶)到計(jì)算機(jī)世界的一個(gè)中間層次,即用戶需求的數(shù)據(jù)模型。l 概念模型常用的表示方法是實(shí)體-關(guān)系法(E-R圖法),這種方法用E-R圖作為描述工具。 3.邏輯模型設(shè)計(jì) 邏輯模型設(shè)計(jì)描述了數(shù)據(jù)的形式,是數(shù)據(jù)倉(cāng)庫(kù)需求部分的重要文檔,是數(shù)據(jù)倉(cāng)庫(kù)細(xì)化的準(zhǔn)備工作。主要包括以下幾方面內(nèi)容: 分析主題域l 主題域是對(duì)某個(gè)主題進(jìn)行分析后確定的主題集合的邊界。l 選擇第一個(gè)主題域所要考慮的是它要足夠大,以便使得該主題域能建設(shè)成為一個(gè)可應(yīng)用的系統(tǒng);它還要足夠小,以便于開(kāi)發(fā)和較快的實(shí)施。如果所選擇的主題域很大并且很復(fù)雜,可以針對(duì)它某個(gè)有意義的子集來(lái)進(jìn)行開(kāi)發(fā)。在每一次的反饋

9、過(guò)程中,都要進(jìn)行主題域分析。 粒度層次劃分l 數(shù)據(jù)粒度是指數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)中保存數(shù)據(jù)的細(xì)化程度或綜合程度的級(jí)別。細(xì)化程度越高,粒度級(jí)別就越??;相反,細(xì)化程度越低,粒度級(jí)別就越高。l 數(shù)據(jù)倉(cāng)庫(kù)邏輯設(shè)計(jì)中要解決的一個(gè)重要問(wèn)題是決定數(shù)據(jù)倉(cāng)庫(kù)的粒度劃分層次,粒度層次劃分適當(dāng)與否直接影響到數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量和所適合的查詢類型。 l 通過(guò)估算數(shù)據(jù)行數(shù)和所需的直接存取存儲(chǔ)設(shè)備數(shù),來(lái)確定是采用單一粒度還是多重粒度,以及粒度劃分的層次。 確定數(shù)據(jù)分割策略 在選擇數(shù)據(jù)分割的標(biāo)準(zhǔn)時(shí),一般要考慮以下幾個(gè)方面因素:數(shù)據(jù)量、數(shù)據(jù)分析處理的實(shí)際情況、簡(jiǎn)單易行以及粒度劃分策略等。 數(shù)據(jù)量的大小是決定是否進(jìn)行數(shù)據(jù)分割和如何分割的

10、主要因素。 數(shù)據(jù)分析處理的要求是選擇數(shù)據(jù)分割標(biāo)準(zhǔn)的一個(gè)主要依據(jù),因?yàn)閿?shù)據(jù)分割是跟數(shù)據(jù)分析處理的對(duì)象緊密聯(lián)系的。 關(guān)系模式定義 數(shù)據(jù)倉(cāng)庫(kù)的每個(gè)主題都是由多個(gè)表來(lái)實(shí)現(xiàn)的,這些表之間依靠主題的公共碼鍵聯(lián)系在一起,形成一個(gè)完整的主題。在概念模型設(shè)計(jì)時(shí),已經(jīng)確定了數(shù)據(jù)倉(cāng)庫(kù)的基本主題,并對(duì)每個(gè)主題的公共碼鍵、基本內(nèi)容等做了描述,接下來(lái)就要對(duì)選定的當(dāng)前實(shí)施的主題進(jìn)行模式劃分,形成多個(gè)表,最終確定各個(gè)表的關(guān)系模式。 與概念模型設(shè)計(jì)中的E-R圖相對(duì),邏輯模型設(shè)計(jì)中需要將其轉(zhuǎn)化為邏輯模型,主要包括星形模型、雪花型模型。 星形模型 用星形模型來(lái)表示邏輯模型,設(shè)計(jì)簡(jiǎn)單,容易被用戶理解。星形模型主要包含兩部分:指標(biāo)實(shí)體

11、和維度實(shí)體。指標(biāo)實(shí)體是位于星形模型中間的實(shí)體,它是用戶最關(guān)心的實(shí)體,為用戶的商務(wù)活動(dòng)提供定量的數(shù)據(jù),指標(biāo)實(shí)體用矩形表示。維度實(shí)體是位于星形模型角星上的實(shí)體,其作用是限制用戶的查詢結(jié)果,用菱形表示。雪花型模型 雪花型模型是星形模型的進(jìn)一步細(xì)化。與星形模型相比,雪花模型增加了一個(gè)詳細(xì)類別實(shí)體,詳細(xì)類別實(shí)體代表維度內(nèi)的一個(gè)單獨(dú)層次,用結(jié)束符號(hào)表示。 4.物理模型設(shè)計(jì) 物理模型設(shè)計(jì)主要是確定數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu),確定索引策略,確定數(shù)據(jù)存放位置,確定存儲(chǔ)分配。 要實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)的物理模型,設(shè)計(jì)人員必須做到以下幾點(diǎn):a) 全面了解所選用的數(shù)據(jù)庫(kù)管理系統(tǒng),特別是存儲(chǔ)結(jié)構(gòu)和存取方法。b) 了解數(shù)據(jù)環(huán)境、數(shù)據(jù)的使用頻度

12、、使用方式、數(shù)據(jù)規(guī)模以及響應(yīng)時(shí)間要求等,這些事對(duì)空間和時(shí)間效率進(jìn)行平衡和優(yōu)化的重要依據(jù)。 c) 了解外部存儲(chǔ)設(shè)備的特性,如分塊原則、塊大小的規(guī)定、設(shè)備的I/O特性等。根據(jù)這些要求,所做的工作包括以下四點(diǎn): 確定數(shù)據(jù)的物理存儲(chǔ)結(jié)構(gòu) 確定索引策略 確定存儲(chǔ)分配 5.數(shù)據(jù)倉(cāng)庫(kù)的生成 這一環(huán)節(jié)主要是把數(shù)據(jù)放入數(shù)據(jù)倉(cāng)庫(kù)中,并進(jìn)行接口的設(shè)計(jì),一旦完成,就可以在其上建立數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用。設(shè)計(jì)接口 將操作型環(huán)境下的數(shù)據(jù)裝載進(jìn)數(shù)據(jù)倉(cāng)庫(kù)環(huán)境,需要在兩個(gè)不同環(huán)境的記錄系統(tǒng)之間建立一個(gè)接口。 在這一過(guò)程中,還要考慮到物理設(shè)計(jì)的一些因素和技術(shù)條件限制,根據(jù)這些內(nèi)容,嚴(yán)格地制定規(guī)格說(shuō)明。 數(shù)據(jù)裝入 在這一步里所要進(jìn)行的就是

13、運(yùn)行接口程序,將數(shù)據(jù)裝入到數(shù)據(jù)倉(cāng)庫(kù)中。主要的工作是: 確定數(shù)據(jù)裝入的次序。 清除無(wú)效或錯(cuò)誤數(shù)據(jù)。 數(shù)據(jù)粒度管理。 數(shù)據(jù)刷新等。 數(shù)據(jù)倉(cāng)庫(kù)生成完后數(shù)據(jù)是穩(wěn)定的,但并不是一成不變的,而是要根據(jù)需求在使用過(guò)程中不斷地維護(hù)和更新。 6.數(shù)據(jù)字典和元數(shù)據(jù) 嚴(yán)格來(lái)說(shuō),這并不是建立數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)步驟,而是建立數(shù)據(jù)倉(cāng)庫(kù)過(guò)程中所要涉及的特殊數(shù)據(jù)。 數(shù)據(jù)字典是數(shù)據(jù)庫(kù)中各類數(shù)據(jù)描述的集合,通常包括數(shù)據(jù)項(xiàng)、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)流、數(shù)據(jù)存儲(chǔ)和處理過(guò)程五個(gè)部分,其中數(shù)據(jù)項(xiàng)是數(shù)據(jù)的最小組成單位,若干個(gè)數(shù)據(jù)項(xiàng)可以組成一個(gè)數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)字典通過(guò)對(duì)數(shù)據(jù)項(xiàng)和數(shù)據(jù)結(jié)構(gòu)的定義來(lái)描述數(shù)據(jù)流、數(shù)據(jù)存儲(chǔ)的邏輯內(nèi)容。 數(shù)據(jù)項(xiàng) 數(shù)據(jù)項(xiàng)是不可再分的數(shù)據(jù)

14、單位。對(duì)數(shù)據(jù)項(xiàng)的描述通常包括數(shù)據(jù)項(xiàng)名、數(shù)據(jù)項(xiàng)含義說(shuō)明、數(shù)據(jù)類型、長(zhǎng)度、取值范圍、取值含義等。數(shù)據(jù)結(jié)構(gòu) 數(shù)據(jù)結(jié)構(gòu)反映了數(shù)據(jù)之間的組合關(guān)系。一個(gè)數(shù)據(jù)結(jié)構(gòu)可以由若干個(gè)數(shù)據(jù)項(xiàng)組成,也可以由若干個(gè)數(shù)據(jù)結(jié)構(gòu)組成。數(shù)據(jù)結(jié)構(gòu)的描述通常包括數(shù)據(jù)結(jié)構(gòu)名、含義說(shuō)明、數(shù)據(jù)項(xiàng)等。 數(shù)據(jù)流 數(shù)據(jù)流是數(shù)據(jù)結(jié)構(gòu)在系統(tǒng)內(nèi)傳輸?shù)穆窂?,?duì)數(shù)據(jù)流的描述通常包括數(shù)據(jù)流名、說(shuō)明、數(shù)據(jù)流來(lái)源、數(shù)據(jù)流去向、平均流量等。其中“數(shù)據(jù)流來(lái)源”用于說(shuō)明該數(shù)據(jù)流來(lái)自哪個(gè)過(guò)程?!皵?shù)據(jù)流去向”用于說(shuō)明該數(shù)據(jù)流將到哪個(gè)過(guò)程去?!捌骄髁俊笔侵竼挝粫r(shí)間(如每天)里的傳輸次數(shù)。 數(shù)據(jù)存儲(chǔ) 數(shù)據(jù)存儲(chǔ)是數(shù)據(jù)結(jié)構(gòu)保存數(shù)據(jù)的地方,數(shù)據(jù)存儲(chǔ)的描述通常包括數(shù)據(jù)存儲(chǔ)名、說(shuō)明

15、、編號(hào)、輸入的數(shù)據(jù)流、輸出的數(shù)據(jù)流、數(shù)據(jù)量、存取頻度、存取方式。 其中“存取頻度”指每小時(shí)或每天或每周存取幾次、每次存取多少數(shù)據(jù)等信息?!按嫒》绞健卑ㄊ桥幚磉€是聯(lián)機(jī)處理、是檢索還是更新、是順序檢索還是隨機(jī)檢索等。另外,“輸入的數(shù)據(jù)流”要指出其來(lái)源,“輸出的數(shù)據(jù)流”要指出其去向?!拜敵龅臄?shù)據(jù)流”要指出其去向。 處理過(guò)程 處理過(guò)程一般用判定表或判定樹(shù)來(lái)描述。數(shù)據(jù)字典中只需要描述處理過(guò)程的說(shuō)明性信息,通常包括處理過(guò)程名、說(shuō)明、輸入、輸出、處理。其中“處理”主要說(shuō)明該處理過(guò)程的功能及處理要求。 可見(jiàn),數(shù)據(jù)字典是關(guān)于數(shù)據(jù)庫(kù)中數(shù)據(jù)的描述,而不是數(shù)據(jù)本身。數(shù)據(jù)字典是數(shù)據(jù)庫(kù)的元數(shù)據(jù)。 元數(shù)據(jù)(MetaDa

16、ta)被定義為關(guān)于數(shù)據(jù)的數(shù)據(jù)(Data about Data)。 目前,元數(shù)據(jù)這一術(shù)語(yǔ)實(shí)際用于各種類型信息資源的描述記錄。元數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中是描述數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)及其環(huán)境的數(shù)據(jù)。 元數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中不僅定義了數(shù)據(jù)倉(cāng)庫(kù)有什么,還指明了數(shù)據(jù)倉(cāng)庫(kù)中信息的內(nèi)容和位置,刻畫了數(shù)據(jù)的抽取和轉(zhuǎn)換規(guī)則的說(shuō)明,存儲(chǔ)了與數(shù)據(jù)倉(cāng)庫(kù)主題有關(guān)的各種商業(yè)信息,而且整個(gè)數(shù)據(jù)倉(cāng)庫(kù)的運(yùn)行都是基于元數(shù)據(jù)的,如數(shù)據(jù)的修改、跟蹤、抽取、裝入、綜合以及使用等。由于元數(shù)據(jù)遍及數(shù)據(jù)倉(cāng)庫(kù)的所有方面,因此它已成為整個(gè)數(shù)據(jù)倉(cāng)庫(kù)的核心。 數(shù)據(jù)倉(cāng)庫(kù)的元數(shù)據(jù)共包含有四類元數(shù)據(jù),除對(duì)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的描述(數(shù)據(jù)字典)外,還有以下三類元數(shù)據(jù):關(guān)于數(shù)據(jù)源的元數(shù)

17、據(jù) 關(guān)于抽取和轉(zhuǎn)換的元數(shù)據(jù) 關(guān)于最終用戶使用數(shù)據(jù)倉(cāng)庫(kù)的元數(shù)據(jù) 數(shù)據(jù)庫(kù)的誕生是一次變革,讓數(shù)據(jù)的存儲(chǔ)變得便捷而有序,發(fā)展出的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)又是一次變革,讓數(shù)據(jù)的價(jià)值通過(guò)整理和分析更加得以發(fā)揮。數(shù)據(jù)集市是由數(shù)據(jù)倉(cāng)庫(kù)發(fā)展而來(lái),某種層面上講,它是屬于企業(yè)某個(gè)部門的小型數(shù)據(jù)倉(cāng)庫(kù),強(qiáng)化了一部分功能,擁有更專業(yè)的目的。雖然數(shù)據(jù)集市比企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用范圍更小,包含數(shù)據(jù)更少,但是進(jìn)一步支撐了所屬部門的數(shù)據(jù)處理和信息獲取能力,是一次體系結(jié)構(gòu)上的巨大進(jìn)步,是對(duì)“大而全”目標(biāo)反向思考的成功結(jié)果。對(duì)于部門而言,了解和應(yīng)用數(shù)據(jù)集市,并將其與企業(yè)數(shù)據(jù)倉(cāng)庫(kù)整合,可能比單純的使用數(shù)據(jù)倉(cāng)庫(kù)更有效。概述:數(shù)據(jù)集市(DataMart

18、s),作為一種更小、更集中的數(shù)據(jù)倉(cāng)庫(kù),為公司提供了一條分析商業(yè)數(shù)據(jù)的廉價(jià)途徑,主要針對(duì)某個(gè)具有戰(zhàn)略意義的應(yīng)用或者具體部門級(jí)的應(yīng)用,支持用戶利用已有的數(shù)據(jù)獲得重要的競(jìng)爭(zhēng)優(yōu)勢(shì)或者找 到進(jìn)入新市場(chǎng)的具體解決方案。是滿足部分特殊用戶群體用來(lái)收集、管理他們本部門、本專業(yè)信息的數(shù)據(jù)倉(cāng)庫(kù)。獨(dú)立數(shù)據(jù)集市從屬數(shù)據(jù)集市數(shù)據(jù)集市 數(shù)據(jù)集市的幾個(gè)特征: 面向部門,由部門定義、設(shè)計(jì)和開(kāi)發(fā),也由部門來(lái)管理和維護(hù)。數(shù)據(jù)集市面向部門的,這就要求它的整個(gè)實(shí)施過(guò)程需要由部門來(lái)主導(dǎo),才能達(dá)到更貼近部門需求,提高部門實(shí)力的效果。 規(guī)模小,便于實(shí)施,購(gòu)買較便宜,投資快速回收。數(shù)據(jù)集市相對(duì)數(shù)據(jù)倉(cāng)庫(kù)的規(guī)模較小,能夠快捷的設(shè)立,發(fā)揮作用,產(chǎn)

19、生的效益能夠較快的覆蓋為設(shè)立數(shù)據(jù)集市付出的投資。 提供更詳細(xì)的、預(yù)先存在的、數(shù)據(jù)倉(cāng)庫(kù)的摘要子集,可升級(jí)到完整的數(shù)據(jù)倉(cāng)庫(kù)。無(wú)論如何,數(shù)據(jù)集市的數(shù)據(jù)和功能都是數(shù)據(jù) 倉(cāng)庫(kù)的一個(gè)子集,并不擁有數(shù)據(jù)倉(cāng)庫(kù)的全部,一些公司通過(guò)先行建立數(shù)據(jù)集市再完善成數(shù)據(jù)倉(cāng)庫(kù),這絕對(duì)是可以做到的,盡管一些專家認(rèn)為這可能導(dǎo)致后生成的數(shù)據(jù)倉(cāng)庫(kù)整體性不夠而產(chǎn)生問(wèn)題。 數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)集成的、面向主題的數(shù)據(jù)集合,設(shè)計(jì)的目的是支持決策支持系統(tǒng)(Decision Support System,DSS)功能。數(shù)據(jù)集市就是企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)子集,它主要面向部門級(jí)業(yè)務(wù),并且只面向某個(gè)特定的主題。為了解決靈活性和性能之間的矛盾,數(shù)據(jù)集市就是數(shù)據(jù)

20、倉(cāng)庫(kù)體系結(jié)構(gòu)中增加的一種小型的部門或工作組級(jí)別的數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)是面對(duì)企業(yè)整體事務(wù),數(shù)據(jù)集市面對(duì)部門級(jí)業(yè)務(wù)無(wú)論企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)是直接建立還是由小型的數(shù)據(jù)系統(tǒng)逐漸擴(kuò)充,它都要保證數(shù)據(jù)對(duì)于整個(gè)企業(yè)內(nèi)部的協(xié)調(diào)和統(tǒng)一,這由數(shù)據(jù)倉(cāng)庫(kù)的作用范圍所決定。數(shù)據(jù)集市作為部門級(jí)和主題向的相對(duì)小型的數(shù)據(jù)應(yīng)用,針對(duì)他所服務(wù) 的對(duì)象,必將進(jìn)行特別的實(shí)用性優(yōu)化,對(duì)數(shù)據(jù)的選取和組合方式也就各有不同,這些數(shù)據(jù)集市之間設(shè)計(jì)的不同,并不會(huì)對(duì)企業(yè)的運(yùn)行產(chǎn)生不良影響,相反可以為服務(wù)對(duì)象提供更優(yōu)質(zhì)的信息服務(wù)。數(shù)據(jù)倉(cāng)庫(kù)具有統(tǒng)一性,數(shù)據(jù)集市各有不同 5.3.3關(guān)于商業(yè)集市的誤區(qū)數(shù)據(jù)集市是一個(gè)數(shù)據(jù)分支子集,它可以從一個(gè)數(shù)據(jù)倉(cāng)庫(kù)中找到,或者是

21、為一個(gè)單獨(dú)業(yè)務(wù)單元提供決策支持而建立的。甚至企業(yè)的大部分戰(zhàn)略都可以由數(shù)據(jù)集市來(lái)完成,在這個(gè)過(guò)程中制定行動(dòng)方針。但是,在建立一個(gè)數(shù)據(jù)集市之前,企業(yè)應(yīng)該知道幾個(gè)關(guān)于數(shù)據(jù)集市的不切實(shí)際的看法。單純用數(shù)據(jù)量大小來(lái)區(qū)分?jǐn)?shù)據(jù)集市和數(shù)據(jù)倉(cāng)庫(kù) 用大小來(lái)判斷一個(gè)企業(yè)是在實(shí)施數(shù)據(jù)倉(cāng)庫(kù)還是數(shù)據(jù)集市的做法是很片面的。尺寸大小不是數(shù)據(jù)集市的本質(zhì)特征,真正的問(wèn)題在于,數(shù)據(jù)集市(它可能是一個(gè)數(shù)據(jù)倉(cāng)庫(kù)的子集)的數(shù)據(jù)模型一定是滿足應(yīng)用的特定需求的。簡(jiǎn)單地理解數(shù)據(jù)集市容易建立數(shù)據(jù)集市的確比數(shù)據(jù)倉(cāng)庫(kù)的復(fù)雜程度低一些,因?yàn)樗会槍?duì)某一需要解決的特定的商業(yè)問(wèn)題,但是圍繞數(shù)據(jù)獲取的很多復(fù)雜問(wèn)題并沒(méi)有減少。數(shù)據(jù)集市要從多個(gè)數(shù)據(jù)源中提取數(shù)據(jù)

22、,這個(gè)過(guò)程很耗時(shí),因?yàn)檫@個(gè)過(guò)程與建立一個(gè)數(shù)據(jù)倉(cāng)庫(kù)一樣,需要相同的計(jì)劃和管理,并且需要把數(shù)據(jù)模型化。 數(shù)據(jù)集市很容易升級(jí)成數(shù)據(jù)倉(cāng)庫(kù)事實(shí)上,數(shù)據(jù)集市針對(duì)特殊的業(yè)務(wù)需要,不可能很容易地伸縮。如果沒(méi)有事先擴(kuò)展數(shù)據(jù)模型,追加數(shù)據(jù)是非常困難的。例如,一個(gè)數(shù)據(jù)集市可以很快找到最暢銷款式的鞋的銷售數(shù)字,為了增加關(guān)于這種鞋的信息,比如新顧客的百分比,就需要新的數(shù)據(jù)模型,這種數(shù)據(jù)集市的擴(kuò)充是困難的。 一個(gè)組織為何要構(gòu)建數(shù)據(jù)集市呢?雖然OLTP和遺留系統(tǒng)擁有寶貴的信息,但是可能難以從這些系統(tǒng)中提取有意義的信息并且速度也較慢。而且這些系統(tǒng)雖然一般可支持預(yù)先定義操作的報(bào)表,但卻經(jīng)常無(wú)法支持一個(gè)組織對(duì)于歷史的、聯(lián)合的、“

23、智能的”或易于訪問(wèn)的信息需求。因?yàn)閿?shù)據(jù)分布在許多跨系統(tǒng)和平臺(tái)的表中,而且通常是“臟的”,包含了不一致的和無(wú)效的值,使得難于分析。數(shù)據(jù)集市將合并不同系統(tǒng)的數(shù)據(jù)源來(lái)滿足業(yè)務(wù)信息需求。若能有效地得以實(shí)現(xiàn),數(shù)據(jù)集市將可以快速且方便地訪問(wèn)簡(jiǎn)單信息以及系統(tǒng)的和歷史的視圖。一個(gè)設(shè)計(jì)良好的數(shù)據(jù)集市將會(huì):發(fā)布特定用戶群體所需的信息,且無(wú)需受制于數(shù)據(jù)來(lái)源系統(tǒng)(如業(yè)務(wù)數(shù)據(jù)庫(kù))的大量需求和操作性危機(jī)。支持訪問(wèn)非易變的業(yè)務(wù)信息(非易變的信息是以預(yù)定的時(shí)間間隔進(jìn)行更新的,并且不受OLTP系統(tǒng)進(jìn)行中的更新的影響)。調(diào)和來(lái)自于組織里多個(gè)運(yùn)行系統(tǒng)的信息,比如賬目、銷售、庫(kù)存和客戶管理以及組織外部的行業(yè)數(shù)據(jù)。通過(guò)默認(rèn)有效值、使各

24、系統(tǒng)的值保持一致以及添加描述以使隱含代碼有意義,從而提供凈化的數(shù)據(jù)。 通過(guò)提供對(duì)于遺留系統(tǒng)和OLTP應(yīng)用程序的選擇來(lái)減少對(duì)這些應(yīng)用程序的要求,以獲得更多所需信息。 5.3.5 建模一般數(shù)據(jù)集市模型的建設(shè)是在數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上基于需求分析得到的結(jié)果,數(shù)據(jù)集市的建模主要針對(duì)事實(shí)表和維表的設(shè)計(jì)。例如,部門員工關(guān)系表,如果事實(shí)表包含部門編碼,則數(shù)據(jù)可以分析到部門;如果事實(shí)表又包含員工編碼,則數(shù)據(jù)既可以分析到部門,又可以分析到員工。一張事實(shí)表除了包含所要分析的維度編碼外,還包括需要分析的度量值。例如,用戶用電分析事實(shí)表,它的主題描述就是按地區(qū)、時(shí)間、電壓等級(jí)統(tǒng)計(jì)用戶的耗電量、應(yīng)收電費(fèi),并進(jìn)行同期對(duì)比;它的

25、維度就是地區(qū)、時(shí)間、電壓等級(jí),度量值包括耗電量、應(yīng)收電費(fèi)等;指標(biāo)來(lái)源就是數(shù)據(jù)倉(cāng)庫(kù)中的計(jì)費(fèi)結(jié)果表、用戶基本信息表。維表一般采用增量的方式進(jìn)行抽取。 2006年,中國(guó)移動(dòng)決定將數(shù)據(jù)集市作為移動(dòng)地市級(jí)公司的建設(shè)重點(diǎn)之一。電信行業(yè)對(duì)于數(shù)據(jù)倉(cāng)庫(kù)并不陌生,為了實(shí)現(xiàn)從產(chǎn)品導(dǎo)向往客戶導(dǎo)向的轉(zhuǎn)變,電信公司紛紛建立以客戶為中心的數(shù)據(jù)倉(cāng)庫(kù),希望依據(jù)客戶的需要、期望及喜好來(lái)制訂策略,提升企業(yè)競(jìng)爭(zhēng)力。經(jīng)過(guò)近幾年的努力,吉林移動(dòng)通信有限責(zé)任公司已經(jīng)成功在省級(jí)公司建立起了面向決策支持的經(jīng)營(yíng)分析系統(tǒng),商業(yè)智能(Business Intelligence,BI)系統(tǒng)也逐漸完善。省級(jí)公司從業(yè)務(wù)系統(tǒng)中將相關(guān)業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、清洗、

26、加工、整理、加載到數(shù)據(jù)倉(cāng)庫(kù)中,在數(shù)據(jù)倉(cāng)庫(kù)中形成基礎(chǔ)的分析數(shù)據(jù)的存儲(chǔ),對(duì)地市一級(jí)公司的營(yíng)銷策略進(jìn)行指導(dǎo)。 問(wèn)題也隨之產(chǎn)生,由于下屬分公司在客戶群體、市場(chǎng)容量、利潤(rùn)來(lái)源等地域差異明顯,省級(jí)公司通過(guò)全省范圍內(nèi)分公司數(shù)據(jù)的匯總和分析,難以對(duì)單個(gè)地市級(jí)分公司產(chǎn)生個(gè)性化決策支持。另一方面,地市一級(jí)的分公司在開(kāi)拓終端市場(chǎng)的過(guò)程中,激發(fā)了旺盛的應(yīng)用需求,具體表現(xiàn)為對(duì)數(shù)據(jù)粒度的要求更加精細(xì)、需求更加靈活多變、要求更強(qiáng)的可操作性。 2005年6月,中國(guó)移動(dòng)通信有限公司制定了中國(guó)移動(dòng)經(jīng)營(yíng)分析系統(tǒng)數(shù)據(jù)集市(試點(diǎn))業(yè)務(wù)技術(shù)建議書。吉林省吉林市成為12個(gè)試點(diǎn)中第一個(gè)“吃螃蟹”的城市。吉林移動(dòng)希望通過(guò)數(shù)據(jù)集市的建設(shè)及時(shí)準(zhǔn)確

27、地了解掌握地市公司的分析需求,更好地為一線地市公司的生產(chǎn)營(yíng)銷服務(wù)。吉林市分公司也希望提升自身的經(jīng)營(yíng)分析水平,落實(shí)集團(tuán)公司的精細(xì)化營(yíng)銷戰(zhàn)略。 數(shù)據(jù)集市項(xiàng)目從2005年6月開(kāi)始組織需求調(diào)研,經(jīng)歷了5個(gè)月的建設(shè)時(shí)間,于2005年11月底上線使用,完成了中國(guó)移動(dòng)集團(tuán)公司試點(diǎn)所要求完成的所有基本集功能以及符合吉林本地特色的擴(kuò)展集的內(nèi)容。 5.4.1信息倉(cāng)儲(chǔ)的開(kāi)始5.4.2數(shù)據(jù)倉(cāng)庫(kù)還是數(shù)據(jù)集市5.4.3敏感的商業(yè)收益5.4.4資源分配 1.簡(jiǎn)述數(shù)據(jù)庫(kù)、數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別有哪些。 2簡(jiǎn)述數(shù)據(jù)庫(kù)設(shè)計(jì)流程。 3.對(duì)數(shù)據(jù)集市的誤區(qū)有哪些,如何正確理解數(shù)據(jù)集市。 4.數(shù)據(jù)倉(cāng)庫(kù)有哪些實(shí)現(xiàn)方案,并簡(jiǎn)述這些實(shí)現(xiàn)方案的優(yōu)缺點(diǎn)。 5.通過(guò)一個(gè)商業(yè)案例,談?wù)勀銓?duì)商業(yè)智能的理解。 Click to edit company slogan

展開(kāi)閱讀全文
溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!