目錄
我在前陣子著手準備自己的網頁版資料科學作品集,在這個過程中也獲得了一些想法與心得,希望可以結合過去的網頁設計、數位行銷與內容創作經驗,與大家分享。
對於設計與行銷工作者來說,將過去的工作成果整理成作品集是常識中的常識,但這對每天在敲程式碼的資料科學家與軟體工程師同樣重要,即使你目前不打算用它來找新工作。
程式設計師們經常被鼓勵做side project,它是一種個人專案,可以讓你把所學的新知識、新技術應用在真實的專案上,並讓自己作更完整的吸收與內化。Side project的好處是不需要受限於正職工作上的情境與限制,可以自由發揮,可以自己決定是否上傳GitHub開源,並寫一篇完整的文章分享專案中的細節、知識與困難。最棒的事情是,完成上述清單後,不用擔心被公司控告洩露商業機密,甚至會收到許多正面的回饋與討論。如果我們持續學習,持續累積作品,那怎麼不考慮進一步將這些作品收集在自己的個人網站上呢?
值得慶幸的是,我們有許多現成的工具可以使用,不需要重新造輪子,像是WordPress,或是去年發佈的Google Analytics 4,這也是我最近正在學習的新工具,希望有機會再分享GA4的使用心得。
當然,我們也可以將作品發佈在GitHub Pages上,但建立自己的網站才能保留最大的發展空間,就像每個消費品的品牌商會上架蝦皮、Amazon,也會建立自己的品牌電商,這是兩種不一樣的策略與佈局。從資料科學的角度切入,在建立網站後,我們可以擁有自己的會員系統,可以收集會員在網頁上的瀏覽記錄,分析會員的閱讀偏好,建立Email精準行銷模型及推薦演算法。在剛才將近60個字的敘述中,就有五個可執行的side project題目,但前提是最困難的第一步,你的網站,你的平台。
以上說了這麼多,我的side project之一是Google Trends Enhanced。Google Trends對行銷人來說是一個超級強大的工具,但它還是有一些缺點,像是不能一次搜尋超過五個關鍵字,以及搜尋時間只要超過9個月左右,搜尋結果就會以周為單位被合併。所以我用Python稍微hack它後,將這個專案佈署在PythonAnywhere的Server上。雖然這個專案沒有機器學習、沒有預測,但更像是打造一個自己的小產品,希望這個小產品可以讓Goolge Trends的使用者們走得更快更遠。
另外,我知道Google Trends Enhanced中偶爾會有一些錯誤發生,但就像LinkedIn創辦人霍夫曼說的,「如果你發佈的第一版產品不能讓你感到羞愧,那你一定發佈得太晚了」。對此,我深信不疑,並身體力行。