2

统计月读(2021 年 10 月)

 2 years ago
source link: https://cosx.org/2021/11/monthly/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

统计月读(2021 年 10 月)

推荐语:Daily R 是一个很棒的基于 blogdown 包搭建的关于 R 的聚合博客,每天定时自动更新,每篇文章都会显示标题和摘要,点击标题后它会自动重定向到文章原始来源地址。认真研究该聚合博客的源码,有助于学习 blogdown 搭建博客、GitHub Action 定时任务、字符串批量清洗加工等技能。同时,为了使该聚合博客汇聚更多高质量的文章,欢迎各位博主增加您的博客地址。

推荐人:楚新元

链接:https://dailyr.netlify.app/,https://github.com/yufree/daily/


推荐语:一年一度的 kaggle 数据科学家调查活动又来了。目前数据已经完成收集工作,分析数据的任务当前正在作为 kaggle 竞赛开放,感兴趣的数据科学家可以来看看今年的数据,说不定还能拿到大奖呢。

推荐人:孔令仁

链接:https://www.kaggle.com/c/kaggle-survey-2021/overview


推荐语:Chirag Patel, 一位哈佛大学医学院的副教授,在开设生物医药的数据科学时遇到了种种问题,例如学生们使用的是什么版本的 R、如果他们的电脑不允许他们安装必要的软件包怎么办等等。而他发现,用 RStudio Cloud 是一个好方法。RStudio Cloud 能帮助学生高效入门,并帮助进行可重复分析来支持医药决策。

推荐人:操懿

链接:https://blog.rstudio.com/2021/10/06/teaching-data-science-with-rstudio-cloud/


推荐语:如果你是一个忠实的 R 粉丝,但也十分想像 Harry Potter 一样成为 Parselmouth (说蛇语的人) 随时随地使用 Python,那么 R 中的 reticulate 包将帮助你直接在 RStudio 里使用 Python 控制台。不仅如此,使用者还可以将 Python 对象和 R 对象自由转换,在 RStudio 环境框中直接看到 Python 对应的换镜框,甚至还能直接使用 R 的语法完成 Python 的功能!

推荐人:任怡萌

链接:https://awong234.github.io/reticulate_pres/


推荐语:最优传输是统计学、机器学习、深度学习、图形学等领域中的热门话题。尽管在应用层面取得了较大成功,其背后的理论解释仍有待完善,如何快速精确实现最优运输问题求解也是当下研究的热点、难点。近日,顾险峰团队推出了 “最优传输理论与计算” 系列网上教程以及实体书籍,旨在系统地讲解最优传输的数学原理以及高效算法实现。系列教程涉及概率论、黎曼几何、偏微分方程、优化等内容。

推荐人:梁杰昊

链接:https://mp.weixin.qq.com/s/5BOdLE3o_LswALDbxn6vcg


推荐语:这是一个使用 reticulate 包的有趣示例,利用 R 和 Python 的联动,从而实现把一个图片转化为其对应样子的数据集,例如下图就是一个对猩猩图片的处理结果。

推荐人:王祎帆

链接:https://ivelasq.rbind.io/blog/reticulate-data-recreation/


推荐语:一个利用 sapplyexpand.grid 等方式来遍历所有可能参数组合的小技巧,配合并行运算和服务器,可以快速完成科研任务。

推荐人:王祎帆

链接:https://www.seascapemodels.org/rstats/2021/10/01/lapply-karate.html


推荐语:作者提供了一个可以用 R 获得不同领域的空间数据的平台,用户可以在其中找到相应的 R 包来获取数据,并且项目提供了简单的 Tutorials 帮助用户快速熟悉对应的 R 包。

推荐人:赵昊蛟

链接:https://ropensci.org/blog/2021/09/28/rspatialdata/


推荐语:Kaggle 打得好,模型一到生产环境就傻眼,说明是时候还 ML 的技术债了。如何使训练和生产部署的链路和数据 gap 完全打通,Google Cloud 团队开始关注 Continuous Training(CT),并借鉴 CI&CD 的思路提出了一种 CT 的 pipeline,见下图。现有的 CT 工具推荐 K8S 的 Jenkins X 和 iterative.ai 的 CML 和 DVC,链接是 NIPS 2014 workshop 的一篇论文《Machine Learning: The High Interest Credit Card of Technical Debt》。

推荐人: 苏锦华

链接:https://research.google/pubs/pub43146/


推荐语:近期热剧《鱿鱼游戏》中,玻璃桥是淘汰率极高的一关。选手每一步都必须在两块外观相同的普通玻璃和钢化玻璃中做出选择,踩到普通玻璃就会掉下去;一旦前面的选手踩到普通玻璃掉下去,那块玻璃就会换成钢化玻璃。如何高效地预测幸存者数量呢?蒙特卡洛模拟可以派上用场。

推荐人:向悦

链接:https://www.jhelvy.com/posts/2021-10-19-monte-carlo-bridge-game/


推荐语:疫情还是没有停止,加强针各位都安排上了吗?要客观了解加强针是否真的有效,以及以前打的两针疫苗作用有多大,可以看看链接这篇文章,其主要结论是:未接种疫苗的人接种疫苗比已接种疫苗的人接种加强疫苗更有效。

推荐人:任焱

链接:https://blog.ephorie.de/covid-19-the-incredible-shrinking-boost-of-the-booster-shot

敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

← COS 访谈第 41 期:统计大师 Donald B. Rubin 教授 工业数据分析实战中的常见误区与对策 →

发表 / 查看评论


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK