- 积分
- 3601
- 贡献
-
- 精华
- 在线时间
- 小时
- 注册时间
- 2012-9-8
- 最后登录
- 1970-1-1
|
登录后查看更多精彩内容~
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 hillside 于 2013-4-15 17:20 编辑
气候统计与其他统计门类有着密切的关联,可以互相借鉴。谢益辉在统计学界是一个非常活跃的人物。据他在网络中介绍,他目前正在美帝国攻读博士学位。谢益辉用R语言研发的knitr软件已经在统计圈进行流传。
对统计兴趣较浓的朋友可以浏览统计之都网站,谢益辉在《统计之都》的网页是http://cos.name/cn/profile/1。
谢益辉乐意回答网友的问题,比如http://cos.name/cn/topic/109998上注明“2天前”的一个帖子:
zhupeilei问:发现R语言的逐步回归筛选的变量有时候太多,而且没有统计学意义,SPSS逐步回归通常能一步到位。不知道SPSS采用的是什么筛选准则。R语言怎么才能实现和SPSS相同的逐步回归???
2 天 前回复
谢益辉答:这年头还在做逐步回归的要么是太聪明了,要么是学术界的惯性太大,导致LASSO还不够响亮。如果有一样东西该从回归教科书里删掉,那就是逐步回归。如果有一样东西应该加入,那就是QR分解。一己之见。
谢益辉的文章观点鲜明,我们来看谢益辉的一篇博文《不懂原理请慎用R》(见他的个人博客http://yihui.name/cn/2008/11/nev ... rstanding-theories/):
不懂原理请慎用R
请各位客官谨记:R是一把锋利的刀,用得不好会割到自己(so sharp that you'll cut yourself)。近日一位小同学的一个问题真是让我颇有些生气。
带着图形界面统计软件的思维来用R的话,十有八九会割到自己。在SPSS、SAS等工具中,虽然看着满屏幕的按钮,但大部分人可能也不害怕,因为不用管它们是什么意思,瞎选一通,按OK,下面就可以洋洋自得看着长篇大论的报表出来了,这种过程很是爽。
到了R的世界,满屏幕只有代码,后来好不容易明白了,原来R不用编程,调用现成函数就可以了,于是乎,开始把各式各样的数据、参数往函数里面扔,扔完了summary()一下,长篇大论的报表也出来了,甚爽。直到有一天,R向你报告说某地方出错了,于是傻了。
这里的案例是AdaBoost,这位同学用adabag包中的adaboost.M1()函数对树模型做boosting,却被告知无法进行。我看 了一下数据,原来因变量是数值变量。于是火了,数值变量你咋用Adaboost.M1啊?它本身是对分类问题做的提升,对于一个回归问题非要驴唇对马嘴, 这不净瞎扯么。
洒家满以为是个有趣的问题,结果饿着肚子回了邮件,真是亏大了。外专业的同仁也就罢了,俺不会说什么,关键是统计专业的。挥一挥衣袖,用膳去鸟。
|
|