【讀書心得】推薦系統
書籍資訊:
書名:推薦系統
作者:陳開江
出版社:電子工業出版社
出版日期:2019/10/01
ISBN:7121354721
ISBN-13:9787121354724
心得:
首先我對這本書的第一印象就是標題有點籠統,《推薦系統》,通常是聖經教科書等級的英文書才會僅用領域名稱當標題。而實際讀完之後我認為這是一本廣度極佳、深度略低的技術書籍。
這本書的廣度相當高,推薦系統的經典演算法幾乎都被包含在內,必談的矩陣分解、冷啟動的 Bandit、近年來最火的深度學習、評估用的 CTR 都有涵蓋到。談到 content based 時,也針對文字探勘、數據挖掘等方向提及 TF-IDF、Word2vec 等 Information Retrieval、Natural Language Processing 的技術。
但範圍如此廣也讓本書的深度、學術成分不足。讀者可以藉由本書認識各演算法的概念,但要完全理解並實作出來還有段距離在,需要自己去尋找更深入的資料做延伸閱讀。
演算法之外的內容則為本書的特色,本書作者有大量實際落地經驗,時常在書中探討許多商業化會遇到的問題,例如:人事上的成本與溝通問題、流量上的採樣與重複檢測技術。
書中這個章節我特別有共鳴,自己在工作中負責過搜尋引擎、熱門榜與推薦系統後也認為他們技術重疊性很高,目標雖不同,但本質上都是在召回資料、計算相關性 (排序)。同時我也曾與書中提及的一樣,依靠 elasticsearch 搜尋引擎來實作過簡易推薦系統。
缺點:
本書有兩個缺點,都跟演算法介紹有關。
首先,談深度學習演算法實作大多離不開套件工具,但本書對於部分套件介紹太過詳細。如上圖直接在書籍中放參數表這類很容易更新的東西只會讓實用性隨著時間降低而已,介紹原理搭配小範例再附上官網或 github 連結即可。
第二點則是書中提及演算法的時候幾乎都沒有附上參考資料,所以當讀者想深入時就會發現自己不知道這些演算法來自哪篇論文、哪篇 survey paper、哪個技術部落格。還好書中提到的演算法都是經典之作,關鍵詞搜尋一下可以很快取得這些資訊。
不過這兩個缺點,前者影響書籍實用性隨時間衰減的速度、後者影響讀者後續的延伸學習,都不影響你在書中學習演算法本身以及參考作者的豐富經驗。
總結:
總體來說我個人很滿意這本書,讀完之後比我想像中的還要實用,但我不會推薦所有人閱讀。
- 如果你是一位推薦系統專業的研究生、學者、研究人員,本書中提到的經典演算法你應該都已知,且本書也沒有太多演算法公式推導、理論證明、論文引用等學術所需資料。
- 如果你才剛開始學習推薦系統甚至沒有業界工作經驗,本書的廣度太高且涵蓋商業落地注意事項、常用工具等實際應用時會需要的知識,對新手來說資訊量過大。
那本書到底適合誰呢?如果你是一位曾經或正在實際應用中上線、維護過任意推薦系統的業界工程師,那這本書適合你的機率就很高。藉由本書,除了能概觀其他常見的演算法之外也能參考作者豐富的實戰經驗與建議,全方位提升自己在推薦系統領域的廣度。
最後,綜合上述說明,我認為符合本書內容的標題應該要類似《推薦系統實戰:常見算法概論與落地經驗談》,較讓人清楚它的客群與自己是否適合閱讀。本次的讀書心得就到此為止,謝謝正在觀看的你。
留言列表