4

第五届中国 R 语言会议(上海会场)纪要

 3 years ago
source link: https://cosx.org/2012/11/5th-china-r-shanghai-summary/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

第五届中国 R 语言会议(上海会场)纪要

中国R语言会议标识

第五届中国 R 语言会议(上海会场)于 2012 年 11 月 3 日~ 4 日在上海财经大学行政楼一楼报告厅成功召开。会议由上海财经大学统计与管理学院主办、统计之都(cos.name)协办,艾瑞咨询(iresearch)、Mango Solutions(mango-solutions)、上海财经大学数理经济学教育部重点实验室以及上海财经大学上海市一流学科(B 类, 统计学)提供了赞助。在两天的会议时间里,群贤毕集,盛况空前。

本次会议吸引了 437 名各界人士注册报名,有 200 多位嘉宾来到现场。报名人数和会场气氛的热烈程度都创下新高。根据注册报名信息,同意在参会者之间分享个人信息的 312 位嘉宾所在单位的汇总如下。

高校和研究所:

大连理工大学、电子科技大学、东华大学、福建师范大学、复旦大学、哈尔滨医科大学、国家人类基因组南方研究中心、湖南大学、湖南科技大学、华大基因研究院、华东师范大学、华中师范大学、江苏科技大学、南京大学、南京信息工程大学、宁波工程学院、上海财经大学、上海大学、上海海洋大学、上海交通大学、上海理工大学、上海社会科学院、上海师范大学、上海中医药大学、同济大学、武汉理工大学、西安财经学院、浙江大学、浙江工商大学、浙江农林大学、芝加哥大学、中国人民大学、中科院上海高等研究院、中科院上海生命科学研究院、中科院上海植物生理生态研究所、中科院生化与细胞研究所、重庆大学、重庆科技学院

企业、事业单位:

3M 中国有限公司、Acxion、ARKO consulting、CBI 易贸、ChinaScope、CIC Kantar Media、eBay Inc、FESCO Adecco、GE Capital、GroupM、HP、HRS、Ihush 俏物悄语、Mango Solutions、Merkle 美库尔咨询公司、Millward Brown、Nielsen、Opera Solutions、SAS 公司、Springer Science+Business Media、TeleNav、UBSS、阿里巴巴云计算、埃森哲、艾瑞咨询、安徽中烟、百度、北京中油瑞飞信息技术有限责任公司、大陆汽车系统管理有限公司、大众点评、到到网、德络易捷国际物流上海有限公司、东软集团(上海)有限公司、分众传媒、福卡智库、港澳资讯、功典资讯股份有限公司、国泰君安证券股份有限公司、国投瑞银基金公司、海通证券、杭州摩数科技信息咨询有限公司、杭州数云信息技术有限公司、华杰资信评级公司、汇添富基金、嘉里置业、江苏百盛工程咨询有限公司、麦包包、麦思瑞信息技术(上海)有限公司、魅力惠 Glamour Sales、南京军区南京总院、瑞易信息技术(上海)有限公司、上海邦助信息技术公司(上海订餐小秘书)、上海伯豪生物技术有限公司、上海词海信息技术有限公司、上海大智慧股份有限公司、上海迪堡金融设备有限公司、上海和伍科技有限公司、上海杰之能信息科技有限公司、上海玖数软件、上海蓝瀚广告有限公司、上海品糖网络科技有限公司、上海睿广智能科技有限公司、上海市万达信息、上海微创、上海吾思信息技术有限公司、上海易贸、上海易迅电子商务有限责任公司、上海银行、上海银联、上海优唯市场研究、上海致卓信息科技有限公司、上海中期、上海众源网络有限公司、上海资信有限公司、盛大游戏、数库财务咨询(上海)有限公司、泰为信息科技有限公司、淘宝、腾讯科技(上海)有限公司、天柏宽带、通用电气、沃尔玛电子商务、西安交通大学出版社有限责任公司、湘财证券、新创机电工程有限公司、新蛋、新华社、新锐互动、亿贝软件工程 、益普索市场咨询有限公司、银联商务有限公司、优酷土豆网、闸北疾控、浙江核新同花顺网络信息股份有限公司、中国建设银行、中国农业银行、中国人寿保险公司、中国移动(深圳)有限公司、中国移动通信集团上海有限公司、中移设计院上海分院、猪八戒网

会议现场20121103

本次会议讨论的主题涵盖了 R 语言在电子商务、大数据和文本挖掘、生物基因、市场营销、可视化及可重复研究等众多方面的精彩应用,共进行了 16 场精彩的报告,并且第一次增设了 Lightning Talks 和专题讨论的环节。会议的流程和主要内容摘录如下:

1、领导致辞

上海财经大学统计与管理学院的尤进红副院长为本次大会致开幕词。尤院长高屋建瓴地概括了 R 在国内的发展情况,并对本次会议提出了殷切的期许。

2、冯兴东:R 语言和其他计算机语言的混合编程

冯教授是本次会议的东道主,来自主办方上海财经大学统计与管理学院。对于 R 与 C 语言的混合编程这一令人望而生畏的话题,冯教授使用生动翔实的例子一开始就吸引了大家的眼球,整场报告听完每个人都跃跃欲试。报告的结束时间和预计时间一分钟都不差,为当天的主题演讲做了一个完美的开头。

3、刘思喆:R 语言环境下的文本挖掘

刘思喆是 R 语言大会的元老了,这次带来了自己在文本挖掘领域的最新心得,以一个非常宏观的视角概括了 R 在整个文本挖掘应用中的体系和资源。最后举了一个流程歌曲的挖掘案例,当 “爱情永远寂寞” 的主题出现在大家眼前时,全场沸腾了。

4、张翔:短文本分类器与电商品类数据挖掘

张翔作为本次会议的主席之一,抽出时间和大家分享了在艾瑞咨询工作中的案例,介绍了短文本分类器与电商品类数据挖掘,对于短文本分类这一难题,提出了一种极具操作性的方法。

5、沈羽、周春英:R 语言在 eBay 搜索引擎反馈与测试中的应用

作为电子商务界的巨头,ebay 这次贡献了豪华的演讲阵容。沈羽和周春英分别分享了自己工作中应用 R 的经验,包括对于用户反馈的文本挖掘以及用 R 进行试验分析和评估的案例,作为第一天上午的最后一场报告,很好地为 R 语言在日常应用以及文本挖掘方面做了一个总结。

6、周扬:基于 R 的地理信息系统

周扬来自全球最大的 R 语言咨询公司 Mango Solutions,当 HTML5 的幻灯片中出现一颗旋转的地球时,全场一片惊叹,紧接着一个又一个超炫的 R 结合 Google Earth 的例子令观众应接不暇,再加上周扬风趣搞笑的演讲风格,使听众下午的困意一扫而光。

7、肖凯:twitteR 包入门和应用

肖凯是 COS 主页最有趣的作者之一,他做出来的东西总能让人在意想不到之处体会到 R 的强大。这次他为大家带来了 twitteR 包的应用,通过抓取 twitter 的信息,并结合文本挖掘和一些统计方法,使得社交网络的分析不再神秘。

8、陈钢:系统生物学和转换医学中的 R 语言

来自华大基因的陈钢从第一届中国 R 语言会议开始就是大家的老朋友了,这次和大家分享了自己工作和研究中的心得。现场的微博中,关于陈钢介绍的华大拥有一千多位数据分析师并且几乎每位分析师都在用 R 的事实是被转发次数最多的。陈钢的主页上有更详细的会议记录。

9、杭兴宜:R / Bioconductor 在生物多维组学数据整合中的应用

来自思博奥科的杭兴宜是生物信息的专家,演讲一开始就提出了要让 R 用户的人生不再只是短短几十年,然后深入浅出地为大家揭示了细胞的遗传奥秘,并介绍了 R 和 Bioconductor 的应用案例。

10、肖嘉敏:网络用户浏览路径分析

肖嘉敏同样来自艾瑞咨询,和我们分享了工作中处理网络用户浏览路径的经验。此外,肖嘉敏还通过分析自己班级同学群的例子,把之前行业里的深入应用用一种所有人都能明白的方式进行了进一步的验证。

11、李忠:R Case Study from ebay APD

作为 R 的资深用户,李忠介绍了 ebay 内部深入使用 R 的案例,在他的精彩演讲以及详尽的例子中,听众进一步地增强了对 R 的信心,也拓宽了在具体应用中使用 R 的思路。

12、洪健飞:啤酒与尿布的当代版——商品分析在电子商务中的应用

一谈到 R 必定有人会联想到近来很火的大数据,一说起数据挖掘必然会提到啤酒尿布的经典例子。可是在如今数据及商业模式大不一样的时代,啤酒尿布的故事又将会是怎样的结果? 来自沃尔玛电子商务的洪健飞用这场精彩的报告解答了大家的疑惑。

13、廖明:营销分析模型及其在广告界的应用

廖明现任传立媒体的董事总经理,领导营销策划部门,有着极其丰富的营销模型的建模经验。面对当今海量的数据、瞬息万变的市场情况、灵活而复杂的各类模型,需要有不一样的工具,R 语言成了现在建模的首选。

14、陈逸波:基于 RHadoop 的关联规则挖掘

最近一年内新增的 R 用户有很多都是被 R 加 Hadoop 在大数据的环境下做统计分析给吸引来的。很多人都听说过这套组合的强大,但是很少有人见过真实的应用。这次陈逸波为大家带来了一些具体的例子,从最基本的配置到真实的应用案例,满足了所有人对 R 加 Hadoop 的期待。

15、模型预测的利器——随机森林

来自浙江大学的刘成昊目前还是在读学生,但是已经具有非常丰富的使用 R 的经验。这次为大家带来了 R 中使用随机森林这一利器的介绍。由于包含了自己学习的心得,所以很能引起听众的共鸣。

16、王雨晨:R 与面向对象统计分析

王雨晨是华东师范大学的本科生,平时对 R 有着非常深入的研究,这次介绍了 R 的特性中比较难解的面向对象的方法。这个功能属于高阶的应用,平时的资料并不多,王雨晨通过自己的摸索,总结出了一些很好的例子,为大家介绍了 S3 和 S4 在统计分析中的应用。

17、魏太云:R 基础作图与可重复研究

魏太云是国内用 R 的圈子中年少成名的典范,他写的 corrplot 包如今已经被很多国家的分析人士使用。这次和大家分享了很多极富表现力的 R 图形,并且介绍了谢益辉开发的已经被热用的 knitr 包。

18、专题讨论

本次 R 语言会议的特色之一是增设了专题讨论。第二天会议的上午和下午各一场。上午的讨论由学界和业界都是大腕的林祯舜主持,上午的演讲嘉宾廖明、肖嘉敏、洪健飞和李忠担任讨论嘉宾。和参会者一起交流了大数据时代下电子商务及营销的机遇与挑战。下午的讨论由本次大会的主席之一李舰主持,来自统计之都的资深 R 用户刘思喆、陈堰平、魏太云、林祯舜担任嘉宾,和参会者一起交流了可重复研究的方法和价值,并且一起讨论了在 R 的学习和使用中遇到的各类问题。

19、Lightning Talks

本次 R 语言会议还增设了 Lightning Talks 的环节,由来自业界的社区、出版社和公司的代表在每人五分钟的时间内对自己的公司或机构进行宣讲,面向听众进行招聘的宣传或者业务的推介,和现场观众持续互动,效果非常好。本次参加 Lightning Talks 的嘉宾包括 COS(统计之都)社区、TopGeek 社区、Springer 出版社、西安交通大学出版社、Mango Solutions、ebay、沃尔玛电子商务、传立媒体、美库尔商务信息咨询、思博奥科生物信息科技有限公司。

经演讲者的授权同意,已将所有同意公开的幻灯片加了超链接供大家下载学习(请遵循 CC 3.0 协议:署名 - 非商业性使用 - 相同方式共享)。

感想和建议

如果您对于中国 R 语言会议还有任何感想、意见或建议,欢迎您在本页面、统计之都人人网页面统计之都新浪微博留言,我们会尽力在今后对会议质量进行进一步的改善。

现任九峰移动医疗 CTO,曾任 Mango Solutions 中国区数据总监。专注于数据科学在行业里的应用。擅长 R 语言的工程开发与分析建模,是 Rweibo、Rwordseg、tmcn 等 R 包的作者。与肖凯合著了《数据科学中的 R 语言》,参与翻译了《R 语言核心技术手册》、《机器学习与 R 语言》。李舰

敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。

统计之都微信二维码

← 数据科学家的崛起 因果推断简介之五:因果图 (Causal Diagram) →

发表 / 查看评论


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK