阿里巴巴大數據競賽介紹

上傳人:細水****9 文檔編號:237302708 上傳時間:2023-12-12 格式:PPT 頁數:16 大小:358.50KB
收藏 版權申訴 舉報 下載
阿里巴巴大數據競賽介紹_第1頁
第1頁 / 共16頁
阿里巴巴大數據競賽介紹_第2頁
第2頁 / 共16頁
阿里巴巴大數據競賽介紹_第3頁
第3頁 / 共16頁

下載文檔到電腦,查找使用更方便

3 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《阿里巴巴大數據競賽介紹》由會員分享,可在線閱讀,更多相關《阿里巴巴大數據競賽介紹(16頁珍藏版)》請在裝配圖網上搜索。

1、Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014相關介紹ALIDATA DISCOVERY阿里巴巴大數據競賽劉曉中國科學院計算技術研究所2014.3.21Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014競賽機制數據介紹評比機制Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014競賽機制阿里巴巴大數據競賽是阿里巴巴集團主辦,在阿里巴巴大數據科研平臺“天池”上開展的,基于天貓海量真實用戶的訪問數據的推薦算法大賽。Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014競賽機制天池-大數據研究

2、平臺“平臺、金融、數據”“數據分享平臺”針對當前學術界面臨的兩個問題,一是缺少有價值的真實的商業(yè)數據;二是缺少具有強大功能的計算平臺支持復雜的數據處理。阿里巴巴集團于2014年正式推出“天池”平臺,“天池”平臺基于阿里集團的海量數據離線處理服務ODPS,向學術界提供科研數據和開放數據處理服務。Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014競賽機制ODPSODPS(Open Data Processing Service)阿里云開放數據處理服務,是阿里巴巴公司借助阿里云提供的大規(guī)模分布式數據處理服務。ODPS以REST API的形式,支持用戶提交類SQL的查詢語言

3、,對海量數據進行處理。Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014競賽機制賽制安排賽制安排Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014競賽機制獎項設置:Season 1 不設獎項,但是會從參賽隊伍中選擇較優(yōu)者進入Season 2階段比賽 Season 2 階段獎項:一等獎:1支隊伍,獎金貳拾萬 二等獎:1支隊伍,獎金伍萬 三等獎:1支隊伍,獎金貳萬(上述獎項以決賽答辯成績的最終名次決定)月星星獎:每期月度榜單排名Top10的參賽隊成員都將獲得搭載云OS的手機一部(具體手機型號在公布榜單時公布)優(yōu)勝獎:決賽全國賽排名Top50的

4、參賽隊成員直接進入阿里巴巴校園招聘綠色通道(即招聘流程省略簡歷篩選及筆試篩選階段,直接進入面試階段),在校期間均有效;并將獲得阿里紀念T恤和大賽獲獎證書 總決賽Top10的主要參賽隊成員可直接入圍“阿里星”計劃,參賽隊的指導老師(如有)將享受天池數據的最高使用權限1年Season 3 線上階段獎項:Season 2 階段的優(yōu)勝者,將會受邀訪問天貓,在天貓實際開發(fā)2014年雙11線上算法,并有機會贏取100萬大獎(組委會將在Season 2結束后公布細則)Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014數據介紹賽題介紹本賽題適用于season1 和season 2的

5、比賽,season 3 為線上賽(season 2 賽后公布題目)。在天貓,每天都會有數千萬的用戶通過品牌發(fā)現自己喜歡的商品,品牌是聯接消費者與商品最重要的紐帶。本屆賽題的任務就是根據用戶4個月在天貓的行為日志,建立用戶的品牌偏好,并預測他們在將來一個月內對品牌下商品的購買行為。Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014數據介紹數據介紹天貓?zhí)峁┝?84位用戶對于9531種商品的操作類型,共提供了182881條記錄。用戶對任意商品的行為都會映射為一行數據。其中所有商品ID都已匯總為商品對應的品牌ID。用戶和品牌都分別做了一定程度的數據抽樣,且數字ID都做了加密

6、。所有行為的時間都精確到天級別(隱藏年份)。Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014數據介紹數據介紹天貓?zhí)峁┝?84位用戶對于9531種商品的操作類型,共提供了182881條記錄。用戶對任意商品的行為都會映射為一行數據。其中所有商品ID都已匯總為商品對應的品牌ID。用戶和品牌都分別做了一定程度的數據抽樣,且數字ID都做了加密。所有行為的時間都精確到天級別(隱藏年份)。Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014數據介紹數據介紹天貓?zhí)峁┝?84位用戶對于9531種商品的操作類型,共提供了182881條記錄。t_alibaba

7、_data.csvXiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014數據介紹Season 1賽季數據1)數據說明:用戶4種行為類型(Type)對應代碼分別為:點擊:0;購買:1;收藏:2;購物車:3 2)提交評分方式:參賽者將預測的用戶存入文本文件中,格式如下:user_id t brand_id,brand_id,brand_id n 上傳的結果文件名字不限(20字以內),文件必須為txt格式。如圖:將預測結果文件上傳至大賽官網結果提交入口即可。(提交結果入口在參賽者的個人中心)Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014數據介紹

8、Season 2賽季數據1)數據獲取方式:參賽者只能登陸阿里巴巴天池集群獲取數據,且數據不能下載,所有數據分析,計算,提交評分都將在天池集群上完成。2)數據說明:提供的數據量,涉及千萬級天貓用戶,萬級天貓品牌,時間跨度4個月的行為記錄。Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014評比機制評比機制準確率與召回率準確率:注:N 為參賽隊預測的用戶數 pBrandsi為對用戶i 預測他(她)會購買的品牌列表個數 hitBrandsi對用戶i預測的品牌列表與用戶i真實購買的品牌交集的個數 Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014評比機制評比機制準確率與召回率最后我們用F1-Score 來擬合準確率與召回率,并且大賽最終的比賽成績排名以F1得分為準。Xiao Liu (VISPER)阿里巴巴大數據競賽March 21,2014排行榜現階段排名

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關資源

更多
正為您匹配相似的精品文檔
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網版權所有   聯系電話:18123376007

備案號:ICP2024067431-1 川公網安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。若文檔所含內容侵犯了您的版權或隱私,請立即通知裝配圖網,我們立即給予刪除!