4

研究过机器学习的 xdm,求提供一个优化的思路

 1 year ago
source link: https://www.v2ex.com/t/904871
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

V2EX  ›  问与答

研究过机器学习的 xdm,求提供一个优化的思路

  passion23 · 9 小时 39 分钟前 · 718 次点击

超大规模(几万亿)稀疏样本拆分成几十万 /上百万的规模进行聚类,现在使用的是 Python Sklearn 库里的 MiniBatchKMeans ,据说还是达不到业务要求

已知:现有方案只有单机场景,应该只能在 Sklearn 的基础上优化

我的任务是要比库的方法有性能提升,看了几天源码,没有什么思路...达不到性能提升的话,这工作应该是悬了

有没有优化过这一块的 xd 提供一点想法?


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK