Skip to the content.

Japanese / English

目標

不正侵入によるデータの漏洩, 正当なユーザによるデータの持ち出し, 解析結果からの(故意または過失による)個人の特定, などの懸念を払拭, 軽減する, システムソフトウェア(データ基盤, OS), データ解析(差分プライバシー, 連合学習), 実応用(医療データ, 軌跡データ活用)の研究を一体的に進め, 安全に積極的なデータ活用可能なSociety 5.0の実現に貢献することを目指します..

本プロジェクト はJST CREST 「基礎理論とシステム基盤技術の融合によるSociety 5.0のための基盤ソフトウェアの創出」 領域に採択されています.

研究内容

目標

  1. 管理者への信頼に依拠しないセキュアファイルシステム
  2. プライバシー保護を強制・追跡可能なシステム機構
  3. 柔軟なプライバシー保護データ解析・機械学習
  4. 医療・軌跡データ実応用での実証

管理者への信頼に依拠しないセキュアファイルシステム

このサブテーマでは、以下について研究する.

プライバシー保護を強制・追跡可能なシステム機構

柔軟なプライバシー保護データ解析・機械学習

このサブテーマでは、以下の項目を研究する.

VLDB23-Olive

連合学習(FL)と信頼実行環境(TEE)を組み合わせることは,プライバシーを保護するFLを実現するための有望なアプローチであり,近年,かなりの学術的注目を集めている.サーバー側でTEEを実装することにより,各ラウンドがサーバーに勾配情報を露出することなく連合学習が進行することを可能にする.これは,特に局所的差分プライバシーを用いるFLのユーティリティの増加に約立つ.しかし,サーバー側TEEの脆弱性を考慮する必要があるが,これはFLの文脈で十分に研究されていない.このサブトピックでは,FLにおけるTEEの脆弱性を分析するためのシステムとアルゴリズムを設計し,TEEを強化するための厳密な防御方法を提案し,プライベートかつ高ユーティリティな連合学習にTEEを活用できるシステムの開発を行う.

vldb23-secSV

連合学習には,各クライアントのデータの貢献度を評価することは重要な課題であり,データ市場,説明可能なAI,または悪意のあるクライアントの検出に応用される.特に,シャープレイ値(SV)は,貢献度評価のためのよく使われた指標である.しかし,既存のFLにおけるSV計算方法は,プライバシーに配慮していない.つまり,既存手法は,サーバーがプライバシー保護されていないFLモデルとクライアントのデータにアクセスできると仮定している.したがって,本トピックでは,プライバシー保護されたSV計算の問題について研究する.我々は,Cross-silo FLにおいて,初めて効率的かつプライベートなSV計算プロトコル,SecSV,を提案した.SecSVの特徴は,ハイブリッドプライバシー保護スキームを利用して,テストデータとモデル間の暗号文-暗号文の乗算を避ける.実験では,SecSVが同型暗号を使用するBaselineよりも5.9-18.0倍速いことを示している.

医療・軌跡データ実応用での実証

  1. 医療サブテーマ
    • 医療サブテーマでは、以下の3つの実証を主に行う
    • 医療現場で実用可能な差分プライバシーによるプライバシー保護システムの開発、デプロイ、実使用経験の蓄積
    • 田浦Gとの共働

個人情報保護を強制するプログラミング基盤 の 医療への展開

ここでは主に、AIを学習する側、特にAI学習に必須である学習データセットのプライバシーを守るため、 田浦Gが開発しているプライバシー強制技術を使った上で、AIをdifferentially private stochastic gradient discent (DPSGD)の枠組みで学習することにより、学習データに使われた患者さんの情報が漏洩しにくいようなAI学習の手法論を確立することが目的です。

セキュアな医用AIの実臨床

ここでは主に、デプロイ側、つまり学習済みのAIをいかに秘密演算やスーパーコンピュータを使って安全に、スケーラブルに実行し、結果を臨床医や患者さんに届けるかを考え、研究を進めて参ります。

体制

論文

  1. Shang Liu, Yang Cao, Takao Murakami, Masatoshi Yoshikawa. “A Crypto-Assisted Approach for Publishing Graph Statistics with Node Local Differential Privacy.” 2022 IEEE International Conference on Big Data (Big Data). 2022.
  2. Shuyuan Zheng, Yang Cao, Masatoshi Yoshikawa, Huizhong Li, Yong Qiang. “FL-Market: Trading Private Models in Federated Learning.” 2022 IEEE International Conference on Big Data (Big Data). 2022.
  3. Ryota Hiraishi, Masatoshi Yoshikawa, Shun Takagi, Yang Cao, Sumio Fujita, Hidehito Gomi. “Mitigating Privacy Vulnerability Caused by Map Asymmetry.” Springer eBooks. 2022.
  4. Shun Takagi, Fumiharu Kato, Yang Cao, Masatoshi Yoshikawa. “Asymmetric Differential Privacy.” 2022 IEEE International Conference on Big Data (Big Data). 2022.
  5. 空閑 洋平, 中村 遼. “遠隔会議システムの計測データを用いた広域ネットワーク品質計測 .” インターネットと運用技術シンポジウム論文集 . 2022.
  6. Ruixuan Cao, Fumiharu Kato, Yang Cao, Masatoshi Yoshikawa. “An Accurate, Flexible and Private Trajectory-Based Contact Tracing System on Untrusted Servers.” Lecture Notes in Computer Science. 2022.
  7. Shuyuan Zheng, Yang Cao, Masayuki Yoshikawa. “Secure Shapley Value for Cross-Silo Federated Learning.” Proceedings of the VLDB Endowment. 2023.
  8. Cao Xiao, Yang Cao, Primal Pappachan, Atsuyoshi Nakamura, Masatoshi Yoshikawa. “Differentially Private Streaming Data Release Under Temporal Correlations via Post-processing.” Lecture Notes in Computer Science. 2023.
  9. Ryota Hiraishi, Masatoshi Yoshikawa, Yang Cao, Sumio Fujita, Hidehito Gomi. “Mechanisms to Address Different Privacy Requirements for Users and Locations.” IEICE Transactions on Information and Systems. 2023.
  10. Xiaoyu Li, Yang Cao, Masatoshi Yoshikawa. “Locally Private Streaming Data Release with Shuffling and Subsampling.” 2023 IEEE 39th International Conference on Data Engineering Workshops (ICDEW). 2023.
  11. Shumpei Shiina, Kenjiro Taura. “Itoyori: Reconciling Global Address Space and Global Fork-Join Task Parallelism.” In Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (SC ‘23). 2023.
  12. Chao Tan, Yang Cao, Sheng Li, Masatoshi Yoshikawa. “General or Specific? Investigating Effective Privacy Protection in Federated Learning for Speech Emotion Recognition.” ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 2023.
  13. Shun Takagi, Yang Cao, Yasuhito Asano, Masatoshi Yoshikawa. “Geo-Graph-Indistinguishability: Location Privacy on Road Networks with Differential Privacy.” IEICE Transactions on Information and Systems. 2023.
  14. Ruixuan Liu, Yang Cao, Yanlin Wang, Lingjuan Lyu, Chen Yun, Chang Hong. “PrivateRec: Differentially Private Model Training and Online Serving for Federated News Recommendation.” KDD ‘23: Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. 2023.
  15. Shun Takagi, Fumiharu Kato, Yang Cao, Masatoshi Yoshikawa. “From Bounded to Unbounded: Privacy Amplification via Shuffling with Dummies.” 2023 IEEE 36th Computer Security Foundations Symposium (CSF). 2023.
  16. Fumiharu Kato, Yang Cao, Masayuki Yoshikawa. “Olive: Oblivious Federated Learning on Trusted Execution Environment against the Risk of Sparsification.” Proceedings of the VLDB Endowment. 2023.
  17. Hisaichi Shibata, Shouhei Hanaoka, Yang Cao, Masatoshi Yoshikawa, Tomomi Takenaga, Yukihiro Nomura, Naoto Hayashi, Osamu Abe. “Local Differential Privacy Image Generation Using Flow-Based Deep Generative Models.” Applied sciences. 2023.
  18. Cao Xiao, Yang Cao, Primal Pappachan, Atsuyoshi Nakamura, Masatoshi Yoshikawa. “Differentially Private Streaming Data Release Under Temporal Correlations via Post-processing.” Lecture Notes in Computer Science. 2023.