多中心研究中需要考虑各中心数据隐私安全问题.之前有听过隐私计算,联邦学习等方法.这次读的文章提出一种one-shot的分布计算算法,主要思想是利用泰勒展开式表示出逻辑回归的log(似然函数),然后用前两阶的值去近似现在中心单位得到一个逻辑回归的最大似然估计的beta值,然后把beta值传给其他中心计算一阶导数和二阶导数.最后再传递回主中心得到一个近似的似然函数,然后argmax计算最终的beta估计值.
- 原文章:Learning from electronic health records across multiple sites: A communication-efficient and privacy-preserving distributed algorithm
- 我的幻灯片
- 非常有用的参考文献:
2024-04-02 更新 🔗
新增STA2212 final project. 这次我们选了Cox 1972年的发表的Regression Models and Life-Tables.主要介绍了KM,log-rank, Cox regression, 以及对cox regression 的PH assumption进行了讨论。
- 我的幻灯片