6

关于搜索统计资源(写给在统计学院学习的学弟学妹之二)

 3 years ago
source link: https://cosx.org/2008/11/how-to-search-for-statistics-resources/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

关于搜索统计资源(写给在统计学院学习的学弟学妹之二)

关键词:参考文献; 搜索; 统计数据; 统计资源

关于搜集资料,其实是许久以来我很想谈的一个话题,因为身边太多太多的同学在这方面根本就没入门。找点资料,也不知上哪里找。顶多 Baidu 一下,高级一些的就 Google 一下,就算完事了。

拜托,老大们,这是二十一世纪哎!

记得古时候有一个词叫作 “獭祭”,语出《礼记 · 月令》:“獭祭鱼”。印象中李商隐和这个词似乎有某种联系,可惜古文修养太差,也弄不清了:

“商隐工诗,为文瑰迈奇古,辞隐事难。及从楚学,俪偶长短,而繁缛过之。每属缀,多检阅书册,左右鳞次,号‘獭祭鱼’”。

元 · 辛文房 ·《唐才子传》

大意也就是说的找资料的事情,可见,写点东西(无论文人与否),都是要资料的。古人把书册一排排鳞次,今人恐怕不会那样做了,很可能就是在遨游(Maxthon)浏览器 1 中一口气点开好多个窗口,然后把网页挨个来看,也算是某种形式的 “獭祭” 吧。

这篇小文,依旧是写给统计学院的学弟学妹们的,因此,仍然围绕着 “统计” 的话题展开。大约也就谈两方面吧:

一、怎样找数据

数据是统计的生命之源,其重要性就不在罗嗦。在上一篇文章 “统计学的领域” 中,我所说的数据来源其实主要是一手数据(调查和试验),做研究当然也可以使用二手数据,也就是别人已经通过调查或试验取得的数据,我们拿过来借用一下。

提到统计数据,可能人们首先想到的就是统计局,不错,这是我们的选择之一,比如中华人民共和国国家统计局,在这个官方网站中,包含了大量的统计数据,其中有年度数据、进度数据、专题数据、部门数据等等。比较方便的是,大多都是文本形式的数据,可以复制出来供分析使用。

很多地方统计局也都有自己的网站,如果需要某地的数据,可以登录相应的网站查看。

除了统计局,也别忘了学校的图书馆,人大的图书馆购买了一些统计数据库,从首页登录就会看到 “参考工具” 一栏中有“年鉴资源库”,点击进入就会看到大量的年鉴资料,不过不幸的是,里面很多资料都是图片格式,不能直接复制出来供分析。

上面说的是中文数据,若要找国际数据,其实 Unitied States 也是个可以考虑的地方,在那里有专门的 Statistics Division,http://unstats.un.org 里面的数据有 Excel 格式的,也提供了相应的 PDF 格式文件。事实上,国外的数据比国内要丰富得多,大家平时浏览网站的时候多多注意,一定会有很多积累的。比如 OECD 的网站U.S. Census Bureau 等等。

二、怎样找参考文献

对于写论文来说,大多数情况下恐怕找参考文献比找数据更重要。

这里首先仍然是介绍我们图书馆的资料,一般说来,中文方面的论文库当然要数 “中国期刊全文数据库”比较全面,其中收录了大量的期刊全文,图书馆网站上给出了登录用户名和密码,大家可以尝试进去看看。统计类的期刊有《统计研究》、《统计与决策》、《数理统计与管理》、《数理统计与应用概率》等等,这些期刊都可以通过右上角的 “期刊导航” 找到。当然,也可以按照关键字搜索论文,网站左侧有检索的文本框,诸多选项大家自己去看吧。

其他的数据库诸如 “万方数据资源系统” 等都是比较好的资源中心,大家可以去尝试尝试;最后要说的是除了文本形式的数据库,其实图书馆的资源中也有视频 / 音频数据库,一些名家的讲座都可以从中直接看到。

中文论文库就不介绍太多了,是个中国人都能自己看懂,下面说说外文数据库资源。

如果要查找 5 年前的期刊论文,那么 JSTOR 也许可以满足你们大部分需要了,JSTOR 就是 Journal Storage 的缩写,网址为 http://www.jstor.org,其中收录的论文基本上都是图片格式,可以在网站上一页一页翻着看,或者直接下载为 PDF 文件阅读(里面仍然是图片格式)。关于统计界的外文刊物,大家不能不知道这些:Journal of the American Statistical Association(JASA)、Annals of Statistics、Journal of the Royal Statistical Society,其实还有 Biometrica 等等,暂时还是别介绍太多了。

Wiley InterScience(图书馆网站上写的 “John Wiley 电子期刊”)这个网站中有不少统计学的宝贝,有空应该去淘一淘,比较难得的是里面有大量的 Online Books,如“Introduction to Bayesian Statistics”,“Regression Models for Time Series Analysis”,“Statistical Analysis and Data Mining”,“Analysis of Financial Time Series (Second Edition)” 等。

其它数据库我平时较少用,不过也是比较好的资源,如 “ProQuest 学位论文全文数据库” 等,在此不多加介绍了。前面提到的 JSTOR 只能看好几年前的期刊论文,如果要看最新的文章的话,也可以试试 EBSCO 或者 ProQuest 数据库,不过至少我似乎没发现 JASA 的文章,可能跟学校购买的数据库限制有关。如果有比较重要的外文文献需要下载全文阅读而学校图书馆又没有购买相应的数据库,那么也可以找你们在国外的同学或朋友,国外大学图书馆购买的英文数据库肯定比我们要全。

说了这么多,归根到底都是一些辅助工具,真正要需要脑子的仍然在于专业知识,否则手中掌握再多的资源也白搭。不过话说回来,能尽早接触统计方面的专业知识,对大家应该也是有好处的。

希望这些东西对大家有用。

本文写于 2006-10-21


  1. 编者注:Maxthon, 在 21 世纪初依靠口口相传风靡大江南北的一款优秀国产浏览器,后被功能强大的 Chorme 以及有强大推广的 360,搜狗慢慢替换掉。
中国人民大学统计硕士,爱荷华州立大学统计学博士,R 包 knitr 的主要作者。现为 RStudio 软件工程师,曾负责 Shiny 包相关开发工作,后转入 R Markdown 相关扩展包的开发,包括 bookdownblogdown。对统计计算、可视化、以及各类网页相关技术感兴趣,有志于对技术写作工具做减法工作,坚信人类浪费了太多时间在期刊论文、学位论文、书籍的排版上。平时主要活跃在 Github 上。个人主页在 https://yihui.name,思想偏激,流水账、意识流甚多,小人之心甚重,慎入。谢益辉

敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

统计之都微信二维码

← 我的一些统计方法观(写给在统计学院学习的学弟学妹之三) 浅析试验设计 →

发表 / 查看评论


Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK