中文名: O'Reilly:社交網站的數據挖掘與分析
作者: Mattbew A.Russell
譯者: 師蓉
圖書分類: 軟件
資源格式: PDF
版本: 掃描版
出版社: 機械工業出版社
書號: 9787111369608
發行時間: 2012年02月01日
地區: 大陸
語言: 簡體中文
簡介:
內容簡介:Facebook、Twitter和LinkedIn產生了大量寶貴的社交數據,但是怎樣才能找出誰通過社交媒介正在進行聯系?他們在討論些什麼?或者他們在哪兒?本書簡潔而且具有可操作性,它將揭示如何回答這些問題甚至更多的問題。你將學到如何組合社交網絡數據、分析技術,如何通過可視化幫助你找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用信息。
《社交網站的數據挖掘與分析》每章都介紹了在社交網絡的不同領域挖掘數據的技術,這些領域包括博客和電子郵件。你所需要具備的就是一定的編程經驗和學習基本的Python工具的意願。
通過本書,你將:
獲得對社交網絡世界的直觀認識
使用GitHub上靈活的腳本來獲取從諸如Twitter、Facebook和LinkedIn等社交網絡API中的數據
學習如何應用便捷的Python工具來交叉分析你所收集的數據
通過XFN探討基於微格式的社交聯系
應用諸如TF-IDF、余弦相似性、搭配分析、文檔摘要、派系檢測之類的先進挖掘技術
通過基於HTML 5和JavaScript工具包的網絡技術建立交互式可視化
資源來自網絡,如侵犯了您的權利,請點擊,謝謝!網盤分流地址:[O'Reilly:社交網站的數據挖掘與分析].(Mattbew A.Russell).師蓉.掃描版.pdf網站建設及優化類pdf專題庫內容截圖: 目錄:
前言
第1章 緒論:Twitter 數據的處理
Python 開發工具的安裝
Twitter 數據的收集和處理
小結
第2章 微格式:語義標記和常識碰撞
XFN 和朋友
使用XFN 來探討社交關系
地理坐標:興趣愛好的共同主線
(以健康的名義)對菜譜進行交叉分析
對餐廳評論的搜集
小結
第3章 郵箱:雖然老套卻很好用
mbox:Unix 的入門級郵箱
mbox+CouchDB= 隨意的Email 分析
將對話線程化到一起
使用SIMILE Timeline 將郵件“事件”可視化
分析你自己的郵件數據
小結
第4章 Twitter :朋友、關注者和Setwise 操作
REST 風格的和OAuth-Cladded API
干練而中肯的數據采集器
友誼圖的構建
小結
第5章 Twitter:tweet ,所有的tweet ,只有tweet
筆PK 劍:和tweet PK 機槍
對tweet 的分析(每次一個實體)
並置潛在的社交網站(或#JustinBieber VS #TeaParty)
對大量tweet 的可視化
小結
第6章 LinkedIn :為了樂趣(和利潤?)將職業網絡聚類
聚類的動機
按職位將聯系人聚類
獲取補充個人信息
從地理上聚類網絡
小結
第7章 Google Buzz:TF-IDF 、余弦相似性和搭配194
Buzz=Twitter+ 博客
使用NLTK 處理數據
文本挖掘的基本原則
查找相似文檔
在二元語法中發Buzz
利用Gmail
在中斷之前試著創建一個搜索引擎……
小結
第8章 博客及其他:自然語言處理(等)
NLP :帕累托式介紹
使用NLTK 的典型NLP 管線
使用NLTK 檢測博客中的句子
對文件的總結
以實體為中心的分析:對數據的深層了解
小結256
第9章 Facebook :一體化的奇跡
利用社交網絡數據
對Facebook 數據的可視化
小結
第10章 語義網:簡短的討論
發展中的變革
人不可能只靠事實生活
期望