點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)

上傳人:文*** 文檔編號(hào):48698327 上傳時(shí)間:2022-01-13 格式:DOC 頁(yè)數(shù):14 大?。?02.90KB
收藏 版權(quán)申訴 舉報(bào) 下載
點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)_第1頁(yè)
第1頁(yè) / 共14頁(yè)
點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)_第2頁(yè)
第2頁(yè) / 共14頁(yè)
點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)_第3頁(yè)
第3頁(yè) / 共14頁(yè)

下載文檔到電腦,查找使用更方便

10 積分

下載資源

還剩頁(yè)未讀,繼續(xù)閱讀

資源描述:

《點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)》由會(huì)員分享,可在線閱讀,更多相關(guān)《點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)(14頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、點(diǎn)擊率及其準(zhǔn)確性研究摘要在互聯(lián)網(wǎng)時(shí)代網(wǎng)頁(yè)點(diǎn)擊率日益成為重要的理論和運(yùn)用熱點(diǎn),本課題正是基于這樣一個(gè)原因圍繞統(tǒng)計(jì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率和準(zhǔn)確性問(wèn)題展開了較為全面的研究。首先對(duì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率問(wèn)題的研究背景、現(xiàn)狀和趨勢(shì)進(jìn)行了闡釋;其次針對(duì)點(diǎn)擊率中存在的問(wèn)題,重點(diǎn)研究了單頁(yè)面統(tǒng)計(jì)、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、利用jsp application和session統(tǒng)計(jì)等三種方法,同時(shí)著眼如何區(qū)分同一IP上不同用戶點(diǎn)擊情況,納入點(diǎn)擊時(shí)間、點(diǎn)擊頻率兩個(gè)因素,設(shè)計(jì)改進(jìn)了點(diǎn)擊率的統(tǒng)計(jì)方法,結(jié)果表明改進(jìn)后的點(diǎn)擊率統(tǒng)計(jì)方法能夠更加準(zhǔn)確反映用戶點(diǎn)擊的真實(shí)情況。關(guān)鍵詞頁(yè)面點(diǎn)擊率;準(zhǔn)確性;點(diǎn)擊時(shí)間;點(diǎn)擊頻率Rese

2、arch on Click-through Rate and Its AccuracyAbstract In the Internet age, the click-through rate of web pages has become an increasingly important theoretical and application hotspot. This topic is based on this reason, focusing on the statistical issues of page click-through rate and accuracy. First

3、ly, the research background, current situation and trend of web page click-through rate are elaborated. Secondly, aiming at the problems of click-through rate, three methods are studied: counting by single page, counting with JSP built-in object application, counting with JSP application and session

4、. In order to distinguish clicks of different users on the same IP, including click time and click frequency, a click rate statistics method was designed and improved. The results show that the improved click-through rate statistics method can more accurately reflect the click-through rate of users.

5、 Key wordspage click rate; accuracy; click time; click frequency131 概述1.1 研究背景與意義當(dāng)今進(jìn)入網(wǎng)絡(luò)時(shí)代、智能時(shí)代和電子商務(wù)時(shí)代,網(wǎng)絡(luò)上電子商務(wù)店鋪、輿論輿情分析人員、文案創(chuàng)作人員等等許多主體都會(huì)更加關(guān)注自己在網(wǎng)絡(luò)上的網(wǎng)頁(yè)備關(guān)注的程度,這種被關(guān)注程度衡量的重要依據(jù)就是點(diǎn)擊率的多少,每天或者是每個(gè)小時(shí)有多少人在點(diǎn)擊網(wǎng)頁(yè),特別是隨著電子商務(wù)發(fā)展,網(wǎng)頁(yè)上的廣告成為一種和電視媒體廣告一樣重要的廣告模式,如何知道廣告瀏覽情況,點(diǎn)擊率也是最重要的衡量指標(biāo)。反映了網(wǎng)頁(yè)上某一內(nèi)容的受關(guān)注程度,經(jīng)常用來(lái)衡量廣告的吸引程度。因此,對(duì)互聯(lián)網(wǎng)網(wǎng)

6、頁(yè)點(diǎn)擊率的研究越來(lái)越重要。當(dāng)前研究人員研究的重點(diǎn)是關(guān)注網(wǎng)站頁(yè)面上某個(gè)內(nèi)容,被點(diǎn)擊次數(shù)與被顯示次數(shù)之比,用公式表示就是Click frequency=clicks/time*100%。點(diǎn)擊率的計(jì)算可以通過(guò)多種方式進(jìn)行,最基本的公式為:點(diǎn)擊率=點(diǎn)數(shù)數(shù)訪問(wèn)數(shù)。如一個(gè)新聞網(wǎng)站的網(wǎng)頁(yè)鏈接在一小時(shí)之內(nèi),某網(wǎng)頁(yè)刊登的廣告被點(diǎn)擊10次,以10s為單位時(shí)間,這個(gè)網(wǎng)頁(yè)上的廣告點(diǎn)擊率=點(diǎn)擊數(shù)訪問(wèn)數(shù)=10/360*100%=2.8%。當(dāng)前通用的計(jì)算方法是指網(wǎng)站的點(diǎn)擊率,也就是指一個(gè)鏈接單位時(shí)間內(nèi)的點(diǎn)擊次數(shù)。在互聯(lián)網(wǎng)廣告成為了商家推崇的一種主流營(yíng)銷方式的時(shí)代,選擇了網(wǎng)站網(wǎng)頁(yè)點(diǎn)擊率與準(zhǔn)確性這個(gè)課題進(jìn)行研究,并把研究的范圍

7、聚焦到電子商務(wù)中網(wǎng)頁(yè)廣告的點(diǎn)擊率問(wèn)題,采用一定的算法預(yù)估精準(zhǔn)廣告投放的效益,在精確廣告投放過(guò)程中扮演了很重要的角色。預(yù)估的準(zhǔn)確性對(duì)廣告主的收益、廣告商的收益以及用戶的友好體驗(yàn)有著重大的影響,因此受到互聯(lián)網(wǎng)企業(yè)的廣泛關(guān)注。這時(shí)用點(diǎn)擊率衡量出一個(gè)比值,有多少人看到一個(gè)鏈接,然后又有多少人點(diǎn)進(jìn)去看,用這兩個(gè)數(shù)字之比來(lái)衡量一個(gè)網(wǎng)絡(luò)內(nèi)容的受歡迎程度和影響程度,如圖1.1在線廣告投放模式所示。圖1.1 在線廣告投放模式但是當(dāng)前采取的方法計(jì)算網(wǎng)頁(yè)點(diǎn)擊率CRT,最突出的特點(diǎn)是這種點(diǎn)擊率計(jì)算方法不重復(fù)計(jì)算24小時(shí)內(nèi)相同IP的點(diǎn)擊行為,因?yàn)橄嗤腎P意味著相同的人,相同的人看一萬(wàn)次和看一次沒有什么區(qū)別。典型的是百

8、度統(tǒng)計(jì)和谷歌統(tǒng)計(jì),使用百度統(tǒng)計(jì)可以很好的區(qū)分搜索推廣與自然流量,可以自動(dòng)推送給搜索引擎爬蟲,一條統(tǒng)計(jì)代碼可以和很多的百度產(chǎn)品結(jié)合在一起,所以百度統(tǒng)計(jì)還是比較方便的,目前常用點(diǎn)擊率統(tǒng)計(jì)方法有三種:第一種是單頁(yè)面統(tǒng)計(jì),第二種是利用jsp的內(nèi)置對(duì)象application進(jìn)行統(tǒng)計(jì)的方法,第三種是利用jsp的application和session進(jìn)行統(tǒng)計(jì)的方法。本課題考慮到因?yàn)辄c(diǎn)擊率可以反映人們對(duì)一個(gè)網(wǎng)站或app喜愛程度,而如何探究點(diǎn)擊率的準(zhǔn)確性就需要仔細(xì)分析,比如在網(wǎng)吧一個(gè)IP可以不同的人登錄,所以點(diǎn)擊率的準(zhǔn)確性是個(gè)值得探討的問(wèn)題。正是基于這樣一個(gè)原因圍繞統(tǒng)計(jì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率和準(zhǔn)確性問(wèn)題展開了較為全面的

9、研究,首先對(duì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率問(wèn)題的研究背景、現(xiàn)狀和趨勢(shì)進(jìn)行了闡釋;其次針對(duì)點(diǎn)擊率中存在的問(wèn)題,重點(diǎn)研究了單頁(yè)面統(tǒng)計(jì)、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、利用jsp application和session統(tǒng)計(jì)等三種方法,同時(shí)著眼如何區(qū)分同一IP上不同用戶點(diǎn)擊情況,納入點(diǎn)擊時(shí)間、點(diǎn)擊頻率兩個(gè)因素,設(shè)計(jì)改進(jìn)了點(diǎn)擊率的統(tǒng)計(jì)方法,結(jié)果表明改進(jìn)后的點(diǎn)擊率統(tǒng)計(jì)方法能夠更加準(zhǔn)確反映用戶點(diǎn)擊的真實(shí)情況。1.2 研究現(xiàn)狀在國(guó)內(nèi)外對(duì)這個(gè)問(wèn)題的研究多年來(lái)一直都是熱點(diǎn),有研究基本理論的,也有研究算法應(yīng)用的,還有創(chuàng)新方法結(jié)構(gòu)的。從國(guó)外典型的有代表性的研究來(lái)看,發(fā)表比較早的研究成果是來(lái)自于Google. Micro

10、soft、Yahoo三大互聯(lián)網(wǎng)公司。這三個(gè)公司近些年來(lái)把廣告點(diǎn)擊率預(yù)估作為了一個(gè)很熱門的研究課題,把廣告點(diǎn)擊率預(yù)估模塊作為實(shí)時(shí)廣告系統(tǒng)中一個(gè)不可或缺的組成部分,在學(xué)術(shù)上和工業(yè)界都有著很深入的研究,研究?jī)?nèi)容的重點(diǎn)是點(diǎn)擊率預(yù)估模型的設(shè)計(jì)、信息的提取和處理、長(zhǎng)短期利益權(quán)衡策略、模型訓(xùn)練分布式系統(tǒng)實(shí)現(xiàn)等方面, 并取得了一系列的理論成果和應(yīng)用成果,這種價(jià)值可以起到聯(lián)鎖作用,也就是說(shuō)預(yù)估效果的好壞嚴(yán)重影響著廣告商的收益、廣告主的廣告投放效果以及用戶的上網(wǎng)體驗(yàn),如圖1.2廣告點(diǎn)擊率預(yù)估問(wèn)題模型所示。圖1.2 廣告點(diǎn)擊率預(yù)估問(wèn)題模型此外,在國(guó)外的研究方面還有從事其他有關(guān)研究的。從國(guó)內(nèi)有代表性的典型研究來(lái)看,隨

11、著國(guó)內(nèi)網(wǎng)絡(luò)理論和信息理論發(fā)展,國(guó)內(nèi)學(xué)者也十分重視點(diǎn)擊率及其準(zhǔn)確性研究,有跟蹤國(guó)外研究前沿的,有獨(dú)創(chuàng)派系的,也有國(guó)內(nèi)國(guó)外結(jié)合的,當(dāng)前的一個(gè)重點(diǎn)就是 信息的提取和處理,由于這是一個(gè)很復(fù)雜的過(guò)程,國(guó)內(nèi)學(xué)者把關(guān)注的重點(diǎn)放在如何從原始數(shù)據(jù)中提取出有助于點(diǎn)擊率預(yù)估的信息,目前取得了一系列成果,通常使用回歸或者分類方法,構(gòu)建點(diǎn)擊率預(yù)估模型,模型中考慮了各種對(duì)點(diǎn)擊率可能產(chǎn)生影響的因素。1.3 研究框架本文將論文分為5個(gè)部分,第一部分研究點(diǎn)擊率及其準(zhǔn)確性概述,第二部分研究點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)原理,第三部分研究點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)方法分析,重點(diǎn)是基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于j

12、sp application和session統(tǒng)計(jì),第四部分研究進(jìn)點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)新方法,主要包括利用點(diǎn)擊時(shí)間優(yōu)化統(tǒng)計(jì)方法和 利用點(diǎn)擊頻率優(yōu)化統(tǒng)計(jì)方法,第五部分對(duì)全文進(jìn)行總結(jié),并對(duì)研究課題進(jìn)行展望。2 點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)原理2.1 點(diǎn)擊率及其準(zhǔn)確性含義通過(guò)前面的概述可以知道點(diǎn)擊率的含義,即網(wǎng)頁(yè)點(diǎn)擊率就是指一個(gè)鏈接單位時(shí)間內(nèi)的點(diǎn)擊次數(shù),最基本的公式為點(diǎn)擊率=點(diǎn)擊數(shù)訪問(wèn)數(shù)。點(diǎn)擊率的公式可表示為: (2-1)當(dāng)前通用的計(jì)算方法是指網(wǎng)站的點(diǎn)擊率,就是指一個(gè)鏈接單位時(shí)間內(nèi)的點(diǎn)擊次數(shù),目前可以用百度統(tǒng)計(jì)來(lái)監(jiān)測(cè),百度統(tǒng)計(jì)點(diǎn)擊率當(dāng)前成為國(guó)內(nèi)最流行和可信的點(diǎn)擊率統(tǒng)計(jì)工具。如一個(gè)新聞網(wǎng)站的網(wǎng)頁(yè)鏈接在一小時(shí)之內(nèi)

13、,某網(wǎng)頁(yè)刊登的廣告被點(diǎn)擊10次,以10s為單位時(shí)間,這個(gè)網(wǎng)頁(yè)上的廣告點(diǎn)擊率=點(diǎn)擊數(shù)訪問(wèn)數(shù)=10/360*100%=2.8%。2.2 點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)方法分類當(dāng)前對(duì)點(diǎn)擊率問(wèn)題的典型研究,目前常用的方法有三種模式。第一種,用戶瀏覽CTR模型預(yù)測(cè)模型。這種方法利用了概率論和統(tǒng)計(jì)論的思想,首先假設(shè)對(duì)網(wǎng)站上網(wǎng)頁(yè)上某個(gè)廣告的每一次點(diǎn)擊都是相互獨(dú)立的獨(dú)立事件,第一次與后面的不相關(guān),則就可以利用相關(guān)性因素和IP位置的因素得到網(wǎng)頁(yè)的點(diǎn)擊率。這種模型是本文研究的重點(diǎn),在操作層面重點(diǎn)設(shè)計(jì)和創(chuàng)新基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、jsp application和session統(tǒng)計(jì)的方法。

14、第二種,動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型。這種方法以智能算法為基礎(chǔ),用到了貝葉斯網(wǎng)絡(luò)模型,貝葉斯網(wǎng)絡(luò)模型是研究過(guò)程的動(dòng)態(tài)模型。這里用到計(jì)算網(wǎng)頁(yè)點(diǎn)擊率主要是對(duì)使用者點(diǎn)擊網(wǎng)頁(yè)廣告的過(guò)程進(jìn)行建模,估算出觀察相關(guān)性、實(shí)際相關(guān)性指標(biāo)。這一個(gè)過(guò)程的建模和估算具體為:假設(shè)使用者點(diǎn)擊URL地址,當(dāng)且僅當(dāng)使用者確實(shí)關(guān)注到了URL這個(gè)鏈接,所謂的觀察相關(guān)性已經(jīng)滿足條件;若使用者點(diǎn)擊后續(xù)的URL地址,則實(shí)際相關(guān)性不符合用戶的要求。這樣的一個(gè)模型大大的提高了計(jì)算點(diǎn)擊的實(shí)際效果,更加具有真實(shí)性。第三種,點(diǎn)擊鏈模型。這種模型是對(duì)CRT預(yù)測(cè)方法的擴(kuò)展,這種方法的最大的優(yōu)點(diǎn)是充分考慮的使用者的心理因素和實(shí)際需求因素,對(duì)網(wǎng)頁(yè)上的廣告進(jìn)行瀏覽

15、,反復(fù)的瀏覽,當(dāng)達(dá)到使用者的需求時(shí)才點(diǎn)擊,這樣的模型建模比較復(fù)雜,但經(jīng)過(guò)人工智能算法分析,則可以比較準(zhǔn)確的不僅計(jì)算了點(diǎn)擊率,而且預(yù)估的使用者的實(shí)際需求,對(duì)商業(yè)上有更高的價(jià)值。2.3 本章小結(jié)本章從分析點(diǎn)擊率的內(nèi)涵和外延出發(fā),對(duì)這一個(gè)概念進(jìn)行了闡釋,爾后研究了點(diǎn)擊率統(tǒng)計(jì)方法,重點(diǎn)分析了點(diǎn)擊率統(tǒng)計(jì)的典型方法,如用戶瀏覽CTR模型預(yù)測(cè)模型、動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型、點(diǎn)擊鏈模型,最后分析了本課題研究中所用到的方法,進(jìn)行了典型的歸納,為后續(xù)研究做好鋪墊。3 點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)方法分析3.1 基于單頁(yè)面統(tǒng)計(jì)這種統(tǒng)計(jì)方法對(duì)于網(wǎng)站的頁(yè)面,當(dāng)點(diǎn)擊了網(wǎng)站的某個(gè)頁(yè)面,計(jì)數(shù)器就統(tǒng)計(jì)一次點(diǎn)擊量,通過(guò)以獨(dú)立的IP地址或者網(wǎng)站

16、頁(yè)面為訪問(wèn)對(duì)象,只要被訪問(wèn)點(diǎn)擊就記錄一次點(diǎn)擊量。在實(shí)際中將統(tǒng)計(jì)代碼放置在需要統(tǒng)計(jì)的網(wǎng)站網(wǎng)頁(yè)內(nèi),完成內(nèi)置代碼就可以實(shí)現(xiàn)點(diǎn)擊量的統(tǒng)計(jì)。主要代碼如下:_hmt.push(_trackPageview, /virtual/login);router.afterEach(to, from) = console.log(to); console.log(to.fullPath); window._hmt.push(_trackPageview, /# + to.fullPath););3.2 基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)Jsp可以內(nèi)置request、response、pageContext

17、、session、application、out、config、page、exception等內(nèi)置對(duì)象,這種應(yīng)用對(duì)象application,是存活范圍最大的對(duì)象,當(dāng)服務(wù)器一直開啟時(shí),application在整個(gè)服務(wù)器運(yùn)行過(guò)程中數(shù)據(jù)一直存在,但利用application統(tǒng)計(jì)也有弊端,這個(gè)程序結(jié)果運(yùn)行分析,也是訪問(wèn)一次頁(yè)面統(tǒng)計(jì)一次。感覺還是不夠好。真正滿意的是瀏覽器打開網(wǎng)頁(yè),到關(guān)閉網(wǎng)頁(yè)算一次,這樣統(tǒng)計(jì)比較實(shí)際。application實(shí)現(xiàn)一個(gè)簡(jiǎn)單的網(wǎng)頁(yè)計(jì)數(shù)器主要代碼如下: page language=java import=java.util.* pageEncoding=UTF-8%String

18、path = request.getContextPath(); base href= My JSP application.jsp starting page 您是第位訪問(wèn)者; 3.3 基于jsp application和session統(tǒng)計(jì)利用Application對(duì)象實(shí)現(xiàn)訪問(wèn)人數(shù)的統(tǒng)計(jì)很常見,這種統(tǒng)計(jì)方法的原理是,Jsp調(diào)用Javeabean命令UseBean中有Scope設(shè)置,當(dāng)訪問(wèn)者打開瀏覽器到關(guān)閉瀏覽器算一次訪問(wèn),每次打開首頁(yè),創(chuàng)建一個(gè)session,這個(gè)session直到瀏覽器關(guān)閉才失效。但總體來(lái)說(shuō),比前兩種要好。在這里為了解決當(dāng)jsp服務(wù)器重啟時(shí)累計(jì)的統(tǒng)計(jì)數(shù)就清零的問(wèn)題,本文利用

19、Application對(duì)象把保存到web.xml的數(shù)據(jù)庫(kù)信息取出來(lái),不但解決安全性問(wèn)題,而且是一個(gè)全局變量,不用每次連接數(shù)據(jù)庫(kù),都寫一串長(zhǎng)長(zhǎng)的數(shù)據(jù)?;趈sp application和session統(tǒng)計(jì)點(diǎn)擊率主要代碼: page language=java contentType=text/html; charset=utf-8 pageEncoding=utf-8%index3.4 本章小結(jié)本章在前面各個(gè)章節(jié)研究的基礎(chǔ)上,深入到網(wǎng)頁(yè)點(diǎn)擊率統(tǒng)計(jì)方法的具體層面,重點(diǎn)分析了單頁(yè)面統(tǒng)計(jì)方法、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)方法、利用jsp application和session統(tǒng)計(jì)方法,

20、這個(gè)三種統(tǒng)計(jì)方法是最基本的方法,也是最典型的方法,對(duì)后續(xù)研究有重要作用。4 點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)新方法4.1 利用瀏覽時(shí)間優(yōu)化統(tǒng)計(jì)方法由于目前本文上述研究分析的“基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于jsp application和session統(tǒng)計(jì)”等3種方法,都能夠統(tǒng)計(jì)出網(wǎng)站網(wǎng)頁(yè)的點(diǎn)擊率,但這中間存在一些問(wèn)題,比如到底是不是不同的人點(diǎn)擊的,到底是過(guò)客還是有需求的客戶,到底是路過(guò)網(wǎng)頁(yè)還是按照客戶的需求訪問(wèn)等問(wèn)題,舉一個(gè)實(shí)際例子,有個(gè)廣告商投放在網(wǎng)絡(luò)上的二個(gè)廣告,分別被放在網(wǎng)頁(yè)的不同的兩個(gè)位置上,統(tǒng)計(jì)得到前者的點(diǎn)擊率是30%,后者的點(diǎn)擊率是10%,究竟哪個(gè)廣告好一些

21、呢?其實(shí)我們得不出任何結(jié)論。我們知道如果不考慮時(shí)間、位置等各種復(fù)雜人類行為因素,絕對(duì)的點(diǎn)擊率水平是沒有什么太大意義的。這些問(wèn)題解決不好,就沒有辦法真實(shí)的統(tǒng)計(jì)出網(wǎng)站網(wǎng)頁(yè)廣告的真實(shí)需求,對(duì)商家的幫助就有差距和偏差。為了解決這個(gè)問(wèn)題,在本章引入了點(diǎn)擊時(shí)間優(yōu)化統(tǒng)計(jì)方法。在基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于jsp application和session統(tǒng)計(jì)方法的基礎(chǔ)上,在網(wǎng)頁(yè)的腳本文件或者代碼中加入點(diǎn)擊進(jìn)入時(shí)間統(tǒng)計(jì)和離開時(shí)間統(tǒng)計(jì),這樣就可以知道訪問(wèn)者在這個(gè)網(wǎng)頁(yè)停留的時(shí)間了,如果停留時(shí)間比較短,比如只有幾秒鐘,就可以認(rèn)為訪問(wèn)者不是真正的需求者,如果在同樣的一個(gè)網(wǎng)頁(yè)上停留比較

22、合理的時(shí)間,比如達(dá)到了閱讀全部?jī)?nèi)容的時(shí)間,則可以認(rèn)為訪問(wèn)者有較大的潛在需求。經(jīng)過(guò)這樣一種改進(jìn),就能夠有效解決統(tǒng)計(jì)真實(shí)需求不準(zhǔn)的問(wèn)題。這種方法是對(duì)基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于jsp application和session統(tǒng)計(jì)三種方法的改進(jìn),通過(guò)實(shí)驗(yàn)可以較為精準(zhǔn)的得到真正的需求者和對(duì)廣告有關(guān)注的關(guān)注者。主要代碼如下:/統(tǒng)計(jì)用戶訪問(wèn)網(wǎng)站頁(yè)面時(shí)間 var tjSecond = 0; var tjRandom = 0; /定時(shí)增加時(shí)間 window.setInterval(function() tjSecond+; /獲取隨機(jī)的時(shí)間 tjRandom = (new

23、Date().valueOf(); /加載 window.onload = function() ; /onbeforeunload 事件在即將離開當(dāng)前頁(yè)面(刷新或關(guān)閉)時(shí)觸發(fā) /該事件可用于彈出對(duì)話框,提示用戶是繼續(xù)瀏覽頁(yè)面還是離開當(dāng)前頁(yè)面 window.onbeforeunload = function() /定義空的容器 var params = ; params.tjRd = tjRandom; /獲取當(dāng)前的url地址 params.url = location.href; params.time = tjSecond; params.timeIn = Date.parse(new D

24、ate() - (tjSecond * 1000); params.timeOut = Date.parse(new Date(); /獲取頁(yè)面的title標(biāo)題 params.title = document.title; /獲取域 params.domain = document.domain; /獲取屏幕的高度 params.sh = window.screen.height; /獲取屏幕的寬度 params.sw = window.screen.width; /獲取語(yǔ)言 params.language = navigator.language; /獲取來(lái)源地址 params.refer

25、= getReferrer(); /定義空變量,用來(lái)做傳遞的參數(shù) var args = ; for (var i in params) if (args != ) args += & args += i + = + encodeURIComponent(paramsi) $.post( + args, jsstr: , function(data) , json) ; 4.2 利用點(diǎn)擊頻率優(yōu)化統(tǒng)計(jì)方法本章第一節(jié)的思路作為解決網(wǎng)站網(wǎng)頁(yè)真實(shí)點(diǎn)擊情況的方法比較有效,在此基礎(chǔ)上還有這樣一種方法,利用點(diǎn)擊頻率優(yōu)化統(tǒng)計(jì)方法解決這種問(wèn)題,這個(gè)方法的基本思路是:當(dāng)訪問(wèn)者在一個(gè)網(wǎng)站網(wǎng)頁(yè)上點(diǎn)擊頻率來(lái)判斷是不是真正

26、的有效的點(diǎn)擊,如果點(diǎn)擊頻率很高,則不是真正的訪問(wèn)者,如果點(diǎn)擊頻率不高,則是真正的訪問(wèn)者。這種方法是在基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于jsp application和session統(tǒng)計(jì)方法基礎(chǔ)上的改進(jìn),和3.1利用瀏覽時(shí)間優(yōu)化統(tǒng)計(jì)方法在解決問(wèn)題的性質(zhì)上一致的,只是利用了單位時(shí)間點(diǎn)擊的次數(shù)。主要代碼如下:Integer id = (Integer)request.getAttribute(id);Map obj=(Map) application.getAttribute(count);if(obj=null)obj = new HashMap();obj.put

27、(id,1);application.setAttribute(count,obj); elseInteger count = (Integer)obj.get(id);if(count=null)count = 1; elsecount+; obj.put(id,count);application.setAttribute(count,obj);4.3 本章小結(jié)本章在第三章研究的基礎(chǔ)上,特別是重點(diǎn)分析了單頁(yè)面統(tǒng)計(jì)方法、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)方法、利用jspapplication和session統(tǒng)計(jì)方法的基礎(chǔ)上,著眼當(dāng)前點(diǎn)擊率計(jì)算存在的主要問(wèn)題,如何區(qū)分來(lái)自于同樣的IP

28、上的不同用戶的點(diǎn)擊情況,特別是網(wǎng)吧電腦貢獻(xiàn)的點(diǎn)擊數(shù)統(tǒng)計(jì)問(wèn)題,從點(diǎn)擊時(shí)間和點(diǎn)擊頻率兩個(gè)方面設(shè)計(jì)了改進(jìn)統(tǒng)計(jì)的方法。5 結(jié)束語(yǔ)在互聯(lián)網(wǎng)時(shí)代網(wǎng)頁(yè)點(diǎn)擊率日益成為重要的理論和運(yùn)用熱點(diǎn),本課題正是基于這樣一個(gè)原因圍繞統(tǒng)計(jì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率和準(zhǔn)確性問(wèn)題展開了較為全面的研究,特別是針對(duì)當(dāng)前研究中存在的問(wèn)題。首先對(duì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率問(wèn)題的研究背景、現(xiàn)狀和趨勢(shì)進(jìn)行了闡釋;其次針對(duì)點(diǎn)擊率中存在的問(wèn)題,重點(diǎn)研究了單頁(yè)面統(tǒng)計(jì)、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、利用jsp application和session統(tǒng)計(jì)等三種方法,同時(shí)著眼如何區(qū)分同一IP上不同用戶點(diǎn)擊情況,納入點(diǎn)擊時(shí)間、點(diǎn)擊頻率兩個(gè)因素,設(shè)計(jì)改進(jìn)了點(diǎn)擊率的

29、統(tǒng)計(jì)方法,改進(jìn)后的點(diǎn)擊率統(tǒng)計(jì)方法能夠更加準(zhǔn)確反映用戶點(diǎn)擊的真實(shí)情況,具有一些理論意義和實(shí)踐意義。本文的研究既有理論上的基礎(chǔ)性,又有方向上的新穎性,還有實(shí)踐上的價(jià)值性,通過(guò)本文的研究梳理出了文本相似度計(jì)算的邏輯過(guò)程和實(shí)踐過(guò)程,有較為重要的價(jià)值。參考文獻(xiàn)1 C.J.Wang,H.H.Chen. Learning user behaviors for advertisements click prediction J. SIGIR 2011 Workshop:Internet Advertising , 2011,38(04): 689701.2陳巧紅,余仕敏,賈宇波. 廣告點(diǎn)擊率預(yù)估技術(shù)綜述J.

30、浙江理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015,24 (6):851857.3歐陽(yáng)晟. 基于Storm與在線機(jī)器學(xué)習(xí)的廣告點(diǎn)擊率預(yù)測(cè)的研究D. 武漢理工大學(xué), 2016.4汪榮貴,沈明玉,偶春生. Bayes網(wǎng)絡(luò)與關(guān)系模型的集成:概率關(guān)系模型J. 微電子學(xué)與計(jì)算機(jī), 2002,24 (3):10001003.5劉唐. 基于多類別特征的在線廣告點(diǎn)擊率預(yù)測(cè)研究D. 北京郵電大學(xué), 2013.6邵迪. 在線廣告中高層特征表示及點(diǎn)擊率預(yù)測(cè)方法研究D. 哈爾濱工業(yè)大學(xué), 2014.7張志浩. 基于深度學(xué)習(xí)的在線廣告點(diǎn)擊率預(yù)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)D. 南京大學(xué), 2015.8孔東營(yíng). 基于在線貝葉斯算法的廣告點(diǎn)擊

31、率預(yù)估D. 中國(guó)科學(xué)院大學(xué),2013.9 Thorsten Joachims. Making large-scale SVM learning practicalJ. Advances in Kernel Methods-Support Vector Learning, 1999,438(42):125130.10 肖垚, 畢軍芳, 韓易, 董啟文. 在線廣告中點(diǎn)擊率預(yù)測(cè)研究J. 華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2017,42(5): 8086.11 Ciaramita M,Murdock V,Plachouras V. Online learning from click data for

32、 sponsored searchJ. the 17th International World Wide Web Conference,2008,07(36):563568. 致謝本論文是在孫發(fā)軍老師的悉心指導(dǎo)下完成的,我衷心表示對(duì)于孫發(fā)軍老師的感謝。寫這篇關(guān)于點(diǎn)擊率及其準(zhǔn)確性研究的分析論文,對(duì)我來(lái)說(shuō)經(jīng)歷了很多,我也了解到了很多沒接觸過(guò)的知識(shí),讓我受益匪淺。 千里之行,始于足下,不積跬步何以至千里,本設(shè)計(jì)能夠順利的完成,也歸功于各位任課老師的認(rèn)真負(fù)責(zé),使我能夠很好的掌握和運(yùn)用專業(yè)知識(shí),并在設(shè)計(jì)中得以體現(xiàn)。正是有了他們的悉心幫助和支持,才使我的畢業(yè)論文工作順利完成。在完成這篇論文的過(guò)程中還是充滿困難和挑戰(zhàn),要感謝我的論文指導(dǎo)老師和我的同學(xué)們,在我遇到疑惑和困難時(shí)候給我的幫助和肯定,使我有信心完成論文接下來(lái)的內(nèi)容,我誠(chéng)心的感謝我所敬愛的孫發(fā)軍老師和幫助我的同學(xué)們,為了你們我將努力學(xué)習(xí),勇敢接受到來(lái)的挑戰(zhàn),不會(huì)退縮。

展開閱讀全文
溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!