《數(shù)據(jù)模型與決策》PPT課件.ppt
《《數(shù)據(jù)模型與決策》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《數(shù)據(jù)模型與決策》PPT課件.ppt(41頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
2020年3月21日8時(shí)31分 數(shù)據(jù) 模型與決策 濮曉龍 2020年3月21日8時(shí)31分 華東師范大學(xué)金融與統(tǒng)計(jì)學(xué)院手機(jī) 13681930388 2020年3月21日8時(shí)31分 教材 數(shù)據(jù) 模型與決策簡明教程作者 王靜龍 梁小筠 王黎明出版社 復(fù)旦大學(xué)出版社 2004 2020年3月21日8時(shí)31分 關(guān)于統(tǒng)計(jì)學(xué)的定義很多 英國是現(xiàn)統(tǒng)計(jì)學(xué)的發(fā)源地 英國 不列顛百科全書 上把統(tǒng)計(jì)學(xué)定義為收集和分析數(shù)據(jù)的藝術(shù) 當(dāng)然還有其它各種定義 大同小異 如 統(tǒng)計(jì)學(xué)是研究不確定性現(xiàn)象數(shù)量規(guī)律性的方法論科學(xué) 等等 統(tǒng)計(jì)是什么 2020年3月21日8時(shí)31分 北京時(shí)間2006年6月30日晚23點(diǎn) 在德國世界杯的一場1 4決賽中 東道主德國120分鐘內(nèi)與阿根廷戰(zhàn)成1比1平 最后的點(diǎn)球大戰(zhàn) 德國以4比2擊敗阿根廷 德國門將萊曼撲出阿根廷兩個(gè)點(diǎn)球 例1 1難以置信 http www my4g org node 530 萊曼之所以表現(xiàn)得如此神勇 與一張柏林城堡酒店 Schloss 的便條有非常大的關(guān)系 這張紙條是德國守門員教練科普克在點(diǎn)球大戰(zhàn)前親手交給萊曼的 這張神秘的紙條猶如一張 武功秘笈 上面到底寫了些什么呢 德國 圖片報(bào) 的記者將這張 秘笈 公布于眾 2020年3月21日8時(shí)31分 有懂德文的嗎 克魯茲 長距離助跑 右上角阿亞拉 注意他的射門腿 左下角羅德里格斯 大力抽射右邊坎比亞索 短距離助跑 左上角 2020年3月21日8時(shí)31分 例1 234 7 的受訪者后悔上大學(xué) 2006 08 14 中國青年報(bào) 2006年8月 中國青年報(bào)社會調(diào)查中心與某網(wǎng)站聯(lián)合開展了一項(xiàng)調(diào)查 共有8777人參與 結(jié)果顯示 34 7 的受訪者在談到自己的大學(xué)生活時(shí) 都覺得 后悔 之所以會 后悔 調(diào)查顯示 51 5 的人認(rèn)為 自己在大學(xué)里 沒學(xué)到什么有用的東西 調(diào)查發(fā)現(xiàn) 讓一些人覺得 后悔 的原因 還有 念了四年 出來還是找不到工作 39 2 對這份調(diào)查結(jié)果 你可有什么想法呢 2020年3月21日8時(shí)31分 例1 3中國美女標(biāo)準(zhǔn)大家認(rèn)同嗎 美女標(biāo)準(zhǔn)粉皮書 中國美 一書作者運(yùn)用美學(xué) 文學(xué) 醫(yī)學(xué) 營養(yǎng)學(xué) 色彩學(xué)和心理學(xué)等專業(yè)知識 第一次用審美的心態(tài)和一雙發(fā)現(xiàn)美的眼睛 系統(tǒng)地總結(jié)和論述了中國美女的內(nèi)涵和標(biāo)準(zhǔn) 給出如下美女標(biāo)準(zhǔn) 你是該書觀點(diǎn)的支持者或是反對者 你想搜集證據(jù)說明你是對的 有什么辦法 2020年3月21日8時(shí)31分 例1 4面對浩如煙海的帳單 會計(jì)如何例行查賬 有23594份運(yùn)貨單的運(yùn)費(fèi)總額需要核查 根據(jù)全面調(diào)查 委托方應(yīng)支付給受托方總費(fèi)用565647元 現(xiàn)抽樣檢查2032份 占8 61 運(yùn)貨單 經(jīng)過推算認(rèn)為23594份運(yùn)貨單中應(yīng)支付給受托方的運(yùn)費(fèi)總額為564968元 顯然 這次受托方吃虧了 少收入679元 下次呢 長期來看 也就是平均來看 積累的誤差為零 此外 抽樣檢查成本至多為10000元 而全面檢驗(yàn)的成本至少為50000元 可是要大家分擔(dān)的 2020年3月21日8時(shí)31分 例1 5怎么回事 下表是1976至1977年美國佛羅里達(dá)州29個(gè)地區(qū)殺人案件中被告膚色和是否被判死刑的326個(gè)犯人的情況 2020年3月21日8時(shí)31分 白人被判死刑的比例較高 難道美國歧視白人 如下的表是上面這張表的細(xì)分 2020年3月21日8時(shí)31分 歸納起來 通常認(rèn)為統(tǒng)計(jì)是用來搜集和處理數(shù)據(jù)的 而數(shù)據(jù)由數(shù)字組成 但并不是單純的數(shù)字 統(tǒng)計(jì)從數(shù)據(jù)中找出信息 并做出結(jié)論 需要工具 圖表 計(jì)算 判斷 但要注意 數(shù)據(jù)并不總顯得牢不可破 數(shù)據(jù)從何而來非常重要 統(tǒng)計(jì)結(jié)論不是絕對的 但在絕大多數(shù)場合是有用的 數(shù)據(jù) 決策的依據(jù) 數(shù)據(jù) 數(shù)據(jù) 數(shù)據(jù) 我們不能做無米之炊 商場選址 肯德基開一家新店進(jìn)行的商圈研究 周邊情況 周邊商廈 飲食店 學(xué)校 娛樂場所 公交站點(diǎn)的數(shù)量和分布等 半徑范圍 從擬建的餐廳出發(fā) 朝不同方向半分鐘 1分鐘 1分半鐘乃至5分鐘步行路程內(nèi)上述這些設(shè)施的準(zhǔn)確位置等 人流量測試 在擬建的餐廳處 周一至周日 每天按不同時(shí)段嚴(yán)格統(tǒng)計(jì) 市場調(diào)查 康泰克要不要復(fù)活 市場調(diào)查 康泰克要不要復(fù)活 數(shù)據(jù)的涵義 數(shù)據(jù)并不僅僅是數(shù)值的意思 數(shù)據(jù)的英文名是data 它是拉丁文datum的復(fù)數(shù)形式 其涵義簡單地說是 事實(shí)資料 數(shù)據(jù)包括的既有數(shù)值型資料 也有文字型資料 模型 模型 用圖表 文字 數(shù)字 符號 以及數(shù)學(xué)表達(dá)式等對客觀現(xiàn)象的描述 模型淡化甚至忽略了客觀現(xiàn)象的次要因素 是對它的本質(zhì)核心部分的描述 要不要開發(fā)新產(chǎn)品 例 某公司正面臨一個(gè)需要做兩次決策的決策問題 第1次決策 要不要開發(fā)一個(gè)新產(chǎn)品 第2次決策 如果決定開發(fā) 則工廠需要擴(kuò)建 究竟是中型擴(kuò)建為好 還是大型擴(kuò)建為好 決策樹模型 這類需要做多次決策的決策問題 我們可以用決策樹 按時(shí)間先后順序形象地將所有可能的決策表示出來 決策樹由結(jié)點(diǎn)和樹叉組成 決策樹模型 不開發(fā)新產(chǎn)品某公司大型擴(kuò)建開發(fā)新產(chǎn)品中型擴(kuò)建 決策樹模型 不確定因素 開發(fā)和不開發(fā)新產(chǎn)品 中型擴(kuò)建還是大型擴(kuò)建為好 市場對該新產(chǎn)品需求量究竟是高 中還是低 是這個(gè)決策問題的不確定的因素 決策樹模型 市場需求高不開發(fā)新產(chǎn)品市場需求中某公司大型擴(kuò)建市場需求低開發(fā)新產(chǎn)品市場需求高中型擴(kuò)建市場需求中市場需求低 六個(gè)西格瑪 SIGMA 理論 1998年3月10日解放日報(bào)的 管理新知 欄目中有一篇文章 其標(biāo)題為 全球著名的美國通用電氣 GE 公司上上下下掀起了一股學(xué)習(xí)管理理論的熱潮 這一切皆因董事長韋爾奇而起 六個(gè)西格瑪 SIGMA 理論 杜絕誤差 杜絕誤差 每百萬次操作中至多只有3 4次失誤 2020年3月21日8時(shí)31分 統(tǒng)計(jì)無處不在 Whenyouanalysisanytopic youareinvolvedinstatistics 當(dāng)然并非沒有統(tǒng)計(jì)就無法運(yùn)作 但有了統(tǒng)計(jì)加入 可以做出更好 更精致的決策 因此統(tǒng)計(jì)是無所不在的 2020年3月21日8時(shí)31分 數(shù)據(jù)的產(chǎn)生 數(shù)據(jù)大體上可分為二種 已存在的數(shù)據(jù) 二手?jǐn)?shù)據(jù) 和原始數(shù)據(jù) 第一手?jǐn)?shù)據(jù) 二手?jǐn)?shù)據(jù)包括公司內(nèi)部數(shù)據(jù)和外部數(shù)據(jù) 如 公司內(nèi)部現(xiàn)有的有關(guān)商務(wù) 經(jīng)濟(jì)和管理等方面的資料 公司外部 包括政府部門 現(xiàn)有的有關(guān)商務(wù) 經(jīng)濟(jì)和管理等方面的資料 每天翻開報(bào)紙或打開電視 就可以看到各種數(shù)據(jù) 比如高速公路通車?yán)锍?物價(jià)指數(shù) 股票行情 外匯牌價(jià) 犯罪率 房價(jià) 流行病的有關(guān)數(shù)據(jù) 確診病例 疑似病例 死亡人數(shù)和出院人數(shù)等等 當(dāng)然還有國家統(tǒng)計(jì)局定期發(fā)布的各種國家經(jīng)濟(jì)數(shù)據(jù) 海關(guān)發(fā)布的進(jìn)出口貿(mào)易數(shù)據(jù)等等 這些數(shù)據(jù)都是二手?jǐn)?shù)據(jù) 2020年3月21日8時(shí)31分 獲得第一手?jǐn)?shù)據(jù)則不象得到二手?jǐn)?shù)據(jù)那么輕松 它通常需要通過實(shí)驗(yàn)或調(diào)查得到 調(diào)查得到的數(shù)據(jù)也稱為觀測數(shù)據(jù) 調(diào)查得到數(shù)據(jù)的例子 某些在華的外資企業(yè)每年至少要花三四千萬元來收集和分析數(shù)據(jù) 他們調(diào)查其產(chǎn)品目前在市場中的狀況和地位并確定其競爭對手的態(tài)勢 他們調(diào)查不同地區(qū) 不同階層的民眾對其產(chǎn)品的認(rèn)知程度和購買意愿以改進(jìn)產(chǎn)品或推出新品種爭取新顧客 他們還收集各地方的經(jīng)濟(jì)交通等信息以決定如何保住現(xiàn)有市場和開發(fā)新市場 市場信息數(shù)據(jù)對企業(yè)是至關(guān)重要的 他們很舍得在這方面花錢 因?yàn)檫@是企業(yè)生存所必需的 絕不是可有可無的 2020年3月21日8時(shí)31分 對于有些問題 比如在不同的醫(yī)療手段下某疾病的治療結(jié)果有什么不同 不同的肥料和土壤條件下某農(nóng)作物的產(chǎn)量有沒有區(qū)別 用什么成分可以提高某物質(zhì)變成超導(dǎo)體的溫度等等 這種在人工干預(yù)和操作情況下收集的數(shù)據(jù)就稱為實(shí)驗(yàn)數(shù)據(jù) 2020年3月21日8時(shí)31分 數(shù)據(jù)有時(shí)也稱為樣本 不過 并不是所有的數(shù)據(jù)都可以稱為樣本的 樣本總是相對總體而言的 任何一個(gè)問題都有其研究對象 研究對象的全體稱為總體 譬如 要想了解上海市民對建設(shè)滬杭磁懸浮高速列車的觀點(diǎn) 需要進(jìn)行調(diào)查 調(diào)查對象是所有上海市民 調(diào)查目的是希望知道市民中對這個(gè)問題的不同看法各自占有的比例 顯然 不可能去調(diào)查所有的上海市民 而只能夠調(diào)查一部分 并根據(jù)這一部分的觀點(diǎn)來了解整個(gè)上海市民的觀點(diǎn) 這種情況下 稱所有 每個(gè) 上海市民對這個(gè)問題的觀點(diǎn)為一個(gè)總體 而調(diào)查時(shí)問到的那部分市民的觀點(diǎn)為該總體的一個(gè)樣本 總體和樣本 2020年3月21日8時(shí)31分 假設(shè)我們要考察股票投資者的組成情況 比如 股民的受教育程度 則全國幾千萬股民就是我們要調(diào)查了解的對象 我們稱之為總體 而每一位股民稱為一個(gè)個(gè)體 一般 我們可以這樣定義總體 總體就是為了某特定研究目的而連結(jié)在一起的個(gè)體的集合 在統(tǒng)計(jì)中總體可分為有限總體和無限總體 如果構(gòu)成總體的個(gè)體的數(shù)量是有限的 則它是一個(gè)有限總體 上面提到的幾千萬股民就是一個(gè)有限總體 若構(gòu)成總體的個(gè)體數(shù)量無窮多 則它是一個(gè)無限總體 對有限總體 如果總體中包含的個(gè)體數(shù)目很多 通常我們也將其視為無限總體 因?yàn)檫@樣處理起來會方便很多 2020年3月21日8時(shí)31分 例1 6彩電的彩色濃度彩電的彩色濃度是彩電質(zhì)量好壞的一個(gè)重要指標(biāo) 它可用一個(gè)實(shí)數(shù)表示 二十世紀(jì)七十年代在美國銷售的SONY牌彩電有兩個(gè)產(chǎn)地 美國和日本 兩地的工廠是按同一設(shè)計(jì)方案和相同的生產(chǎn)線生產(chǎn)同一牌號SONY彩電 連使用說明書和檢驗(yàn)合格的標(biāo)準(zhǔn)也是一樣的 關(guān)于彩色濃度X的標(biāo)準(zhǔn)是 目標(biāo)值為m 公差為5 即當(dāng)X在 m 5 m 5 內(nèi)該彩電的彩色濃度合格 否則不合格 在七十年代后期 美國消費(fèi)者購買日本產(chǎn)SONY彩電的熱情高于購買美國產(chǎn)SONY彩電 原因何在 2020年3月21日8時(shí)31分 表各等級彩電的比例 2020年3月21日8時(shí)31分 例1 7魚塘估魚為了了解魚塘里大概有多少條魚 我們先撈出50條魚 將其做了標(biāo)志并放回魚塘 一天后從魚塘里再撈出100條魚 發(fā)現(xiàn)其中8條魚有我們做的標(biāo)志 則我們可以粗略地認(rèn)為魚塘里大概有50 100 8 625條魚 這里 魚塘里所有的魚是總體 其總體數(shù)量多少不知道 正是我們要了解的 而撈出的100條魚則是樣本 根據(jù)樣本的情況 有標(biāo)志的魚所占的比例 可以對總體的情況做出估計(jì) 這里估計(jì)的效果好不好呢 2020年3月21日8時(shí)31分 樣本質(zhì)量不好的原因通常有如下幾種原因 登記性誤差 低級誤差 人為干擾 官出數(shù)字 數(shù)字出官 惡劣可惡 統(tǒng)計(jì)法 代表性誤差 代表性不強(qiáng) 數(shù)據(jù)正確 但它不能說明問題 設(shè)計(jì)不合理 方便樣本 樣本的質(zhì)量 有時(shí)可對數(shù)據(jù)的質(zhì)量作檢查 2020年3月21日8時(shí)31分 統(tǒng)計(jì)軟件 統(tǒng)計(jì)軟件的種類很多 如SAS SPSS S plus Statistica Eviews GAUSS MATLAB R軟件等 有些功能齊全 有些價(jià)格便宜 有些容易操作 有些需要更多的實(shí)踐才能掌握 還有些是專門的軟件 只處理某一類統(tǒng)計(jì)問題 面對太多的選擇往往給決策帶來困難 這里介紹下述二種軟件 2020年3月21日8時(shí)31分 Excel 它嚴(yán)格說來并不是統(tǒng)計(jì)軟件 但作為數(shù)據(jù)表格軟件 必然有一定統(tǒng)計(jì)計(jì)算功能 而且凡是有MicrosoftOffice的計(jì)算機(jī) 基本上都裝有Excel 但要注意 有時(shí)在裝Office時(shí)沒有裝數(shù)據(jù)分析的功能 那就必須裝了才行 當(dāng)然 畫圖功能是都具備的 對于簡單分析 Excel還算方便 但隨著問題的深入 Excel就不那么 傻瓜 需要使用函數(shù) 甚至根本沒有相應(yīng)的方法了 多數(shù)專門一些的統(tǒng)計(jì)推斷問題還需要其他專門的統(tǒng)計(jì)軟件來處理 Minitab 這個(gè)軟件是很方便的功能強(qiáng)大而又齊全的軟件 也已經(jīng) 傻瓜化 但在我國用的不如SPSS與SAS那么普遍 目前正處于大力推廣階段 其實(shí) 對于大多數(shù)人來說 只要學(xué)會使用一種 傻瓜式 軟件 使用其他的僅僅是舉一反三之勞 最多看看幫助和說明即可 2020年3月21日8時(shí)31分 謝謝- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)據(jù)模型與決策 數(shù)據(jù)模型 決策 PPT 課件
鏈接地址:http://appdesigncorp.com/p-7430337.html