3

统计月读(2022 年 7 月)

 2 years ago
source link: https://cosx.org/2022/08/monthly/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

统计月读(2022 年 7 月)

推荐语:可以称得上划时代的几何学教学技术,通过网页实现交互式高亮,随着阅读流程一同标记文本和对于绘图的内容,把几何原本做成了一本网页上可以动态看的教科书。另外提醒一下,网页配色有黑白两种模式,切换在右上角。

推荐人:孔令仁

链接:https://elements.canberead.com/


推荐语:Bin Yu 老师在 ICM 2022 上的最新报告 Interpreting Deep Neural Networks towards Trustworthiness,从可信赖的角度解释深度神经网络。

推荐人:梁杰昊

链接:https://www.youtube.com/watch?v=hyanrQZfuxM


推荐语:基于 magick 包和脸部识别算法批量制作个人头像。

推荐人:黄湘云

链接:https://www.garrickadenbuie.com/blog/process-profile-picture-magick/


推荐语:这篇论文将迁移学习(机器学习的一个分支)应用于高维线性回归模型。除了目标模型的样本之外,它还使用了来自其他相关的回归模型的辅助样本,以提高估计和预测的最优收敛率。 显然,如何寻找合适的、能给目标模型提供有用信息的辅助样本是一个需要考虑的问题。如果已知哪些辅助样本是有用的,就相应的提出一个 estimator 和一个 predictor,并建立它们的最优性。如果不知道哪些辅助样本是有用的,可以应用作者提出的一个数据驱动的迁移学习过程(名为 Trans-Lasso)来找到它们。作者还将 Trans-Lasso 方法应用于有关基因表达之间关联的数据集。结果表明,Trans-Lasso 通过合并来自多个不同组织的数据作为辅助样本,提高了目标组织中基因表达预测的性能。

推荐人:朱书慧

链接 / 论文信息:Li, S., Cai, T. T., & Li, H. (2022). Transfer learning for high-dimensional linear regression: Prediction, estimation and minimax optimality. Journal of the Royal Statistical Society Series B, Statistical Methodology, 84(1), 149–173. https://doi.org/10.1111/rssb.12479


推荐语:介绍了如何利用 R Markdown 写学术论文、利用 Zotero 进行文献管理以及利用 Notion 做笔记。其中 Zotero 可以与 R Studio 直接集成,Notion 也可以和 Zotero 集成,从而更加便捷地进行论文写作。

推荐人:王祎帆

链接:https://www.ds-econ.com/write-your-whole-paper-in-r-it-is-better/


推荐语:面对晦涩难懂的学术著作,如何较快地确定这个文章的主题是不是符合自己所需求,通过文本分析关键词和主题挖掘可以较快地粗略地了解其内容。这个案例中对希罗多德的希波战争的著作《Histories》做了一些分析。

推荐人:赵昊蛟

链接:https://boiled-data.github.io/Histories.html


推荐语:在大学中建立一个 R 社区,特别是在 covid-19 的影响下,这件事会显得更有意义。文章通过采访的形式介绍了这个 R 社区,还提供了相关 R 项目的 github 链接。

推荐人:操懿

链接:https://www.r-consortium.org/blog/2022/07/19/growing-an-r-community-at-a-state-university


推荐语:R 可以把地形图画得如此精细,甚至还可以绘制出阴影效应。

推荐人:任焱

链接:https://dominicroye.github.io/en/2022/hillshade-effects/


推荐语:这篇文章比较详细的讨论了 R 中的编码问题(即使用了 R 很久也未必清楚),正确使用正则表达式可以提高运行效率,而 useBytes=TRUE 是一个危险的参数设定。

推荐人:任焱

链接:https://blog.r-project.org/2022/07/12/speedups-in-operations-with-regular-expressions/index.html


推荐语:一个小巧的文本分析软件 AntConc ,用于文本聚类、关键词提取、词云绘制等。之前用过一款叫 KH Coder 的软件,与 AntConc 功能相似,同样小巧实用。

推荐人:宋文轩


推荐语:一步一步、一行一行地介绍 ggplot2 绘图的过程,对新手应该十分友好,是快速入门 ggplot2 绘图的好文章。

推荐人:黄湘云

链接:https://www.miriamheiss.com/posts/graphing-with-ggplot/


推荐语:一个生成模型的 tutorial,主要围绕 Bayesian inference 和 Langevin dynamics 等非参方法进行讨论,同时从 optimal transport (Wasserstein) 角度出发讨论了这些生成模型的一阶优化方法。

推荐人:聂宇舟

链接:https://akorba.github.io/resources/Baltimore_July2022_ICMLtutorial.pdf


推荐语:近年来机器学习的各大顶会上,图神经网络(GNN)的相关文章数量暴涨;在工业界的搜索、推荐、反欺诈等场景,GNN 也取得了不错的效果。相较于学术界所关注的模型结构,工业界更看重模型的可扩展性等,本文对 GNN 在工业界的具体应用做了系统总结。

推荐人:向悦

链接:https://zhuanlan.zhihu.com/p/423342532

敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

统计之都微信二维码

R 语言制作地区分布图及其动画 →

发表 / 查看评论


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK