聯邦學習屬於大資料嗎

聯邦學習屬於大資料嗎

聯邦學習屬於大資料。聯邦學習(Federated machine learning/Federated Learning),又名聯邦學習,聯合學習,聯盟學習。聯邦機器學習是一個機器學習框架,能有效幫助多個機構在滿足使用者隱私保護、資料安全和政府法規的要求下,進行資料使用和機器學習建模。

隨著數字化程序加快,產生了大量資料。通過機器學習技術可以自動化地挖掘資料中蘊藏的寶藏,經過大量資料訓練出來的機器學習模型已經應用在各類場景中,正在深刻改變著我們的世界,例如精準醫療、臨床輔助診斷、新藥研發、人像識別、聲紋識別、千人千面推薦演算法、圖片、語音、自然語言等多模態學習。在應用中,模型的精度、泛化能力等至關重要,而這些都賴於機器對大量資料的學習 。

受限於法律法規、政策監管、商業機密、個人隱私等資料隱私安全上的約束,多個數據來源方無法直接交換資料,形成“資料孤島”現象,制約著人工智慧模型能力的進一步提高。聯邦學習的誕生即是為了解決這一問題。

聯邦學習技術及資料隱私保護大會上明確提出了“聯邦機器學習”這個概念。資料是機器學習的基礎 。而在大多數行業中,由於行業競爭、隱私安全、行政手續複雜等問題,資料常常是以孤島的形式存在的。甚至即使是在同一個公司的不同部門之間實現資料集中整合也面臨著重重阻力。

在現實中想要將分散在各地、各個機構的資料進行整合幾乎是不可能的,或者說所需的成本是巨大的。隨著人工智慧的進一步發展,重視資料隱私和安全已經成為了世界性的趨勢。每一次公眾資料的洩露都會引起媒體和公眾的極大關注,例如Facebook的資料洩露事件就引起了大範圍的抗議行動。