Hadley Wickham给使用R语言编程的新手(和老手)的建议

《Hadley Wickham给使用R语言编程的新手(和老手)的建议》

R-posts.com上这篇文章是政治学者 Philip Waggoner 对 RStudio 的首席科学家 Hadley Wickham 的访谈,题目是 Advice to Young (and Old) Programmers: A Conversation with Hadley Wickham.
以下是我读过之后印象比较深的几点。

当前关于数据科学的学习资源众多,对于想要使用R从事数据科学的人们来说,如何把信号和噪音区分开呢?Hadley认为他的书 R for data science (中文版《R数据科学》) 就是一个不错的开始,因为这本书的写作目的就在引领有志于数据科学的人入门。(这本书虽然没有覆盖使用R进行数据科学尝试的方方面面,但作为入门真的是上佳之选,因而口碑特别好,而且重要的是,Hadley还在网上把这本书免费公开了。)

Hadley强调了一个强大社区的重要性。他认为当谈到选择编程语言时,不应该只根据技术优点来选择它们,而应该根据社区来选择它们。R社区非常强大,充满活力,自由,开放,并且包含了广泛的领域。因而,R吸引了数量众多的使用者,而当这些人集结成社区,身为其中一员的个体自己的生活会容易得多。

Hadley还谈到与人交流的重要性,鼓励大家尝试并找到一个R学习社区。当你和其他人一起工作时,学习和保持动力要容易得多。不论是参加本地的R见面会还是积极参与网上的社区,如R-Studio社区网站等,都很好。目的是找到像其他一样也在学习的人,与他们分享你的成功、你的尝试和你的失败。这些交流使人更有可能坚持到你会做一些真正有用的事情。

访谈还涉及到技术复杂性、简单性和可用性之间的权衡。Hadley谈到了R或Python这种编程语言相较于STATA等商用统计软件的优势和劣势。最大的优势是不受限于商业软件的开发者所给定的分析框架,可以通过编程和各种R包来实现无数可能。Hadley还谈到了R和Python的对比:他认为相比Python而言,R有更多东西是内置的,可以不必学那么多编程的概念,因而可以更快的利用R这门工具开始工作。

访谈的最后,Hadley还鼓励了那些初学R并经常体会到挫折感的人们。即使是他在写R代码的时候,偶尔还是会感到沮丧。他认为这只是程序设计中很自然的一部分。因此,挫折感每个人都会经历,但随着时间的推移越来越少。编写R代码时如果卡住,不要忙着责备自己,休息一下,做点有趣的事,然后回来再试一次。

本文曾发在我的豆瓣日记上。

点赞