0

统计月读(2022 年 11-12 月)

 1 year ago
source link: https://cosx.org/2023/01/monthly/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

统计月读(2022 年 11-12 月)

推荐语:shiny 现在有 Python 版本了,这是一篇 Python 中使用 shiny 的教程

推荐人:孔令仁

链接:https://appsilon.com/shiny-for-python-introduction/


推荐语:和机器人聊聊天活就干了。

推荐人:任焱

链接:https://github.com/isinaltinkaya/gptchatteR


推荐语:介绍条形图和箱线图的种种替代,在描述数据分布方面,数据量少时可以考虑展示原始数据,在数据量多时,可以考虑岭线图、提琴图等,ggdist 包提供许多一步到位的函数实现。Cédric Scherer(https://www.cedricscherer.com/)的这篇文章质量非常高,值得一读,还有配套的幻灯片和讲解视频。

推荐人:黄湘云

链接: https://z3tt.github.io/beyond-bar-and-box-plots/


推荐语:lterpalettefinder 包提供从给定图片中提取颜色的功能,可用于构造与已有的颜色风格相统一的统计图形。

推荐人:宋文轩

链接:https://cran.r-project.org/web/packages/lterpalettefinder/index.html


推荐语:一篇很有深度的短文,讲解了 Python 中 NotImplemented 和 NotImpementedError 使用的场景和区别。

推荐人:孔令仁

链接:https://s16h.medium.com/pythons-notimplemented-type-2d720137bf41


推荐语:这篇经典文献是合成控制方法的开山之作。为研究巴斯克地区的恐怖活动对经济的影响,Abadie and Gardeazabal (2003)提出通过选取适当的权重,对其他地区进行线性组合,来合成一个在各经济特征上与巴斯克地区更为相似的 “合成控制地区” 作为对照,从而对恐怖活动对巴斯克经济的影响进行统计推断。结果表明,在 20 世纪 60 年代末恐怖主义爆发后,巴斯克的人均 GDP 相对于没有恐怖主义的合成控制地区下降了约 10 个百分点。

推荐人:朱书慧

文章信息:Abadie, A. and Gardeazabal, J. 2003. Economic Costs of Conflict: A Case Study of the Basque Country. American Economic Review 链接:https://xueshu.baidu.com/usercenter/paper/show?paperid=b9b8a6f807b94ecb62740fef1f4ff6c7&site=xueshu_se&hitarticle=1&sc_from=pku doi:10.2139/ssrn.293120


推荐语:最近 ChatGPT 大火,再介绍一个相关的内容。可以用 ChatGPT 在 R 中创造并分析数据集,并且帮我们修正 bug,感觉利用 ChatGPT 来做大作业的未来越来越近了。

推荐人:王祎帆

链接:https://blog.ephorie.de/chatgpt-can-create-datasets-program-in-r-and-when-it-makes-an-error-it-can-fix-that-too


推荐语:一些统计概念的交互可视化,对于理解基础概念可能有很好的帮助。

推荐人:孔令仁

链接:https://rpsychologist.com/viz


推荐语:关于 “稳定分布” 的定义和一些有趣应用:1)根据正态分布为 2 范数稳定分布,从直观上理解中心极限定理。2)根据不同范数下的稳定分布,通过采样 Sketching Matrix 实现降维,从而快速近似估计超高维向量的范数,可用于设计局部灵敏哈希算法(Locality Sensitive Hashing)

推荐人:梁杰昊


推荐语:这篇博客介绍了在时间序列预测任务中纳入预测区间的一个想法,可以更好地刻画时序预测中的不确定性,并且这个目标使用 scikit-learn 库就可以完成。

推荐人:任怡萌

链接:https://towardsdatascience.com/time-series-forecasting-with-conformal-prediction-intervals-scikit-learn-is-all-you-need-4b68143a027a


推荐语:偏差和方差的权衡是机器学习的核心问题,这篇博客提供了理解偏差 - 方差权衡的贝叶斯视角。

推荐人:向悦

链接:https://towardsdatascience.com/understanding-bias-variance-trade-off-from-a-bayesian-perspective-6c31645fcaa9


推荐语:#30DayMapChallenge 一位数据科学家参与的 30 天地图绘制挑战:每天以一个特定主题绘制地图,其中绝大部分精美的地图都是由 R 绘制而成,展现了 R 可视化的魅力。我个人最喜欢的一张图来自 Day 24 (Fantasy) 。

推荐人:宋文轩

链接:https://github.com/nrennie/30DayMapChallenge/tree/main/2022


推荐语:开源 3D 打印机 VORON2.4 的采购清单,照着链接在淘宝,1688 上买,可以在 2500 以内搞定 250mm 长宽高的可打印 ABS 材料的 FDM 打印机。

209816757-48cec1a7-950a-4b1a-874b-665a7a1781f4.png

推荐人:苏锦华

链接:https://docs.qq.com/sheet/DYnVpeVNUTHFTaHdw?tab=BB08J2


推荐语: flowingdata 2022 年评选的最佳可视化项目,比较有意思的是《华盛顿邮报》做的选区高尔夫球游戏(马里兰第三选区简直是噩梦)、电厂难题选择投票还有北极的碳排放。

推荐人:于淼

链接:https://flowingdata.com/2022/12/29/best-of-2022/


推荐语:借着世界杯的浪潮,考古发现了一篇有一丝丝好玩的论文,用网络分析对瓜瓜(瓜迪奥拉)梦三巴萨 tiki taka 战术的做了一些探索,分析了球员之间交互的复杂网络的一些特征,肯定了瓜瓜战术 (梦三巴萨) 的独特性[狗头]。

推荐人:赵昊蛟

链接:https://doi.org/10.1038/s41598-019-49969-2


敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

统计之都微信二维码

统计月读(2022 年 10 月) →

发表 / 查看评论


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK