3

统计月读(2021 年 5 月)

 2 years ago
source link: https://cosx.org/2021/06/monthly/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

统计月读(2021 年 5 月)

推荐语:前两周刚用 blogdown 新建了自己的博客,本月则推荐一篇与此相关的内容——blogdown 相关的更新。这篇文章的目的是强调一些作者用来重建 他的网站 的步骤,并试图恢复网站中的图形渲染。这篇文章能帮助建立个人博客的 “小白” 更好地理解如何建立一个个人网站。

推荐人:任怡萌

链接:https://solomonkurz.netlify.app/post/2021-05-03-blogdown-updates-prompted-a-website-overhaul-these-are-my-notes/


推荐语:文章给出了用 R 绘制足球运动员的属性百分比图(Percentile Radars/Pizza’s),现在你也可以看看自己喜欢的球员是不是 “六边形战士” 了。当然也不仅限于球员,可以拓展到学生成绩可视化、国家地位可视化等等。

推荐人:王祎帆

链接:https://www.gettingbluefingers.com/tutorials/RadarPizzaChart


推荐语:R 的 4.1.0 版本在 5 月 18 日发布,这一版本涵盖了许多有意思的变化,而这篇文章正是介绍了这些有意思的变化。首先,4.1.x 系列将会是最后支持 32 位的 R 系列。其次,R 的 4.1.x 系列引入了一些新语法,而这些新语法不能在之前的版本运行,这就要求开发者在使用新引入的语法时非常谨慎。除此之外,在 magrittr 包、匿名函数、合并因子、分割数据框等方面,新的 R 版本也有一定的变化。

推荐人:操懿 链接:https://www.jumpingrivers.com/blog/new-features-r410-pipe-anonymous-functions/


推荐语:列举了新手会犯的一些小错误,例如 1. 对 c() 的用法; 2. 不加空格(亲测新手常犯,会让人读起来很难受,尤其是判作业的助教 (T▽T)); 3. 对向量操作中的每个元素用 for 循环(需要注意的是 for 循环并不是不好的,对于复杂的操作,用 for 循环会更清晰); 4. 强行用 lapply 等操作代替 for 循环; 5. 在熟悉 R 基础操作前就使用 tidyverse; 6. 不看 vignettes(包的详细文档); 7. 不使用 debug 等等。

推荐人:王祎帆

链接:https://davidhughjones.medium.com/rookie-r-mistakes-ea00a0ef4d9


推荐语:VAE 作为经典的生成模型,经常和 GAN 进行比较,CVAE 常用于控制生成风格,VAE 和 CVAE 学了后还是不懂?就这代码学习更佳,这个仓库是一个在 MNIST 手写字体图片数据集上实现的极简 VAE 和 CVAE 模型代码。

推荐人:苏锦华

链接:https://github.com/timbmg/VAE-CVAE-MNIST


推荐语:如何假模假式地用贝叶斯网络开始数据分析与评估边的稳健性。Data Analysis with Bayesian Networks: A Bootstrap Approach

推荐人:苏锦华

链接:https://arxiv.org/pdf/1301.6695.pdf


推荐语:如果你和我一样,“画图五分钟,调色一小时”,那么你一定喜欢这条 “五彩缤纷” 的推特。打开它,解锁经典 rainbow 调色板以外的新世界。

推荐人:向悦

链接:https://twitter.com/moriah_taylor58/status/1395431000977649665?s=20


推荐语:torchaudio 包提供了’pytorch” 和’torchaudio’的 R 端接口,为音频方面的深度学习提供数据集、模型和预处理设施的访问。

推荐人:李璇

链接:https://cran.r-project.org/web/packages/torchaudio/index.html


推荐语:用随机森林训练完模型我们通常都会绘制 importance plot 来尝试解释模型,要小心这可能是靠不住的。文章作者实验以后发现,就预测 accuracy 而言,“重要” 的变量未必真的在模型解释层面上重要。

推荐人:任焱

链接:https://eranraviv.com/random-forest-importance-measures-are-not-important/


推荐语:作者一步一步教我们使用 blogdown 时如何对模板进行简单的改造,生成悬浮体目录(floating toc),写长篇博客或者比较复杂的报告时候,这个技巧会很有用。

推荐人:任焱

链接:https://mickael.canouil.fr/post/floating-toc-in-blogdown/


敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

← 因果推断——现代统计的思想飞跃 为什么用户不爱钱:一篇学术论文的诞生记 →

发表 / 查看评论


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK