面對數據隱私問題,大數據是否會失去吸引力?

現今企業對大數據的使用幾乎是司空見慣的,倡導者聲稱它可以幫助決策,增加收入和生產力並降低運營成本。 但這需要以數據隱私為代價。

憑藉這些優勢,國內和國際公司,銀行和政府組織現已積累了大量數據。 但是,在過去十年間駭客的攻擊下,它們完全無法保護這些數據,而且破壞的數據通常會在Dark Web上出售。

被波及的企業遭受了一些聲譽損害,企業希望監管罰款和客戶的數據收集繼續有增無減。 客戶本身是無從指責的,但他們的信息(無論是財務,病歷等或用戶名和密碼)是否已被洩露,使他們遭受身份盜用,經濟損失或其他帳戶的其他損害行為無從得知。 由此可知,在進行數據挖掘時,隱私是一個問題。

未經我們明確許可,企業為何堅持收集數據? 他們期望通過數據分析實現什麼,人類智能無法確定服務或產品提供商和客戶關係應該是什麼? 言而總之,對於企業在商言商的立場來說,這一切都歸結為一件事; 都是為了賺錢。

就個人而言,我認為數據科學應該留在學術界的陰暗走廊(希望道德感仍然適用),而不是用於獲得利潤或便於國家行為者的監督。 這些事情本應永遠不會發生,但……

但大數據仍被用於許多有價值的應用程序,例如天氣預報,氣候變化分析,城市運營和社會公正。此類申請涉及使用大數據而非個人使用,即不會洩露個人身份信息(PII)。

返回紙質檔案?

鑑於前面提到的黑客數量,數百萬用戶受到違法行為的影響,而且公司依然無法保護這些數字的數據被竊取。 更有甚者,許多人甚至不對其挖掘資料的過程進行加密,或在權限管理方面相當鬆懈(例如,使用較弱的密碼)。我們已經知道很長一段時間以來,金融和醫療機構是對網絡罪犯最有吸引力的目標。而 為什麼有價值數據的持有者會忽略基本的網絡安全原則?因此, 我主張回歸所有敏感交易(財務和醫療)以及在文件櫃中存儲這些交易,就像過去一樣。 當黑客可以遠程發起攻擊時,連接到全球互聯網就相當危險。而 在文件櫃上想啟動遠程攻擊本來就較為困難,不是嗎?

當然,大數據集不僅僅是金融交易或臨床訪問的數據庫。 我們對數字和個人生活的各個方面進行追蹤,記錄和存儲,以供將來分析。 他們稱之為定量或預測分析,而不是侵犯隱私。 根據數據科學家或現成軟件創建的算法,我們使用他們的服務或購買他們的產品還不夠,其他見解是必要的。

隱私是死的,長期監視

如果您認為自己擁有在線隱私,我不想破壞您的幻想,因為不使用特定工具(例如Tor,Signal和ProtonMail),您在網上所做的一切都會以某種方式被追蹤。 您的瀏覽器搜索,網站訪問,社交媒體互動和在線評論都是各種數據集的一部分。 官方的說法是個性化用戶體驗,但在大多數情況下,它主要適用於完善個別化行銷,以及達到有效的廣告投放等等。

Big Tech,谷歌,Facebook,亞馬遜等公司都大量投資於大數據,因為它們的收入取決於它。 您會注意到對某個主題的評論都會在Facebook上產生相關廣告。 亞馬遜的Alexa,Apple的Siri以及最近的Google’s Assistant都默認收集音頻,以加強未來在語音識別和相關AI技術方面的努力,在此過程中隱私只能被一定程度的犧牲

幸運的是,時代變遷,許多國家執行數據和隱私保護法,必要時承擔大企業及其運營方法。

資料治理

總是涉及侵犯隱私被認為是數據挖掘的最大議題,如何遵守適用法規是一個眾所周知的問題。如 谷歌和Facebook已經因此而收到數百萬美元的罰款。 Facebook預期將被FTC罰款50億美元

這些都清楚地表明政府準備對數據隱私的保護採取更強硬的立場,歐盟的GDPR被視為保護用戶的關鍵立法。 事實上,現在其他國家的立法往往反映了GDPR的關鍵原則。 在美國,雖然聯邦政府還未通過相關法律。但幾個州(包括加利福尼亞州,與CCPA(加利福尼亞州) “消費者隱私法”(Consumer Privacy Act)在其立法中採用了類似的原則。

顯然,數據挖掘存在隱私問題,已收集數據的企業必須遵守法規或面臨處罰。 我國專注於全球巨頭的違法行為,但同樣的 GDPR原則應該適用於所有數據收集活動,即便你沒有歐洲客戶也應該遵守。 當然,保護您的客戶或用戶數據總歸是值得的。

那些考慮大數據計劃的人也必須考慮所涉及的挑戰。 我很高興地指出,大數據相關的技術並不容易。 且數據科學家和相關專業人員並不為數眾多。 相關的成本的是非常昂貴的所以還未過份普及。

確保數據質量存在問題,特別是如果收集的數據來自多個來源。 刪除PII很困難,特別是如果您認為多個“匿名”事實的組合可能無意識地識別特定人員。

用戶要求隱私。 這議題不會消失,隨意貨幣化和轉售與用戶或客戶活動相關的所有數據的公司必須確保刪除PII。 否則後過就必須自負……

總之,雖然大數據有其優勢,但有必要分析一切嗎? 過去的產品和服務銷售涉及該服務或產品的質量以及通過推薦或積極評價獲得的聲譽,因而需要大數據分析。然而現在,對於客戶來說防止他們違法是不夠的。譬如去醫院的訪客永遠不該被放置在保險,房地產或任何其他未被要求的行業的營銷數據庫中。

而作為使用多種解決方案的網路用戶,為什麼不像我一樣行事呢? 通過使用VPN聯網(使地理位置數據無用)和廣告攔截器確保各項大數據的蒐集變得毫無意義。 只在您需要時在智能手機上激活位置服務和GPS。 您給予他們的信息越少(跟踪我們的所有人)越好。 個性化是一件好事,然而過分侵犯您個人的隱私就不是了

在我看來,大數據無法在許多領域適用,而那些關注隱私的人應該停止使用收集個人數據而不考慮我們隱私的服務。 “可是你能擁有一個您專屬的Facebook頁面,”你可能會如是說。 當然,但我這樣做,是因為我只發布我希望每個人都能看到的內容 – 沒有我的家人或雇主會反對的家庭照片或評論。 我厭惡某些綠色蔬菜,猿猴總統或不道德的商業行為是我的事情,我不希望任何人使其具有商業可行性。 任何關於我自己的一切都是私密的……除了追踪我生活角落的 – CCTV 的各個方面,我花了多少錢、住在哪個地方去哪裡旅行都是我個人的隱私。
沒錯,我重視我的隱私,那麼你呢?

轉自IPSWITCH官方部落格