文章从统计和概率

DIY数据科学行动

我写了一篇关于DIY数据的科学早在3月在那篇文章中,我说,黑客在公共数据集,并有可能在未来几年是一个大问题我看到一个很好的例子,今天早上我在想什么。

阿拉斯泰尔·库特把一堆从MTA和十字转门数据求出了最常用的纽约地铁站在高峰时间GitHub他发布的代码和嵌入在他的博客上。

如果我是一所高中的数学老师,我会接替他的工作,让我的学生一个项目一起工作MTA使大量的数据可以玩这种东西是青少年在纽约高度相关他们会理解数据和锻炼。

科学数据和工具做DIY数据每天都变得更容易我希望我们所有进入数据窃听公开并开始一起合作这个东西至少,它会导致更多的数据科学家和我们可能了解一些有趣的事情关于我们自己和我们的世界在同一时间。

顺便说一句,联合广场是最活跃的地铁站在高峰时间市中心南增值!

DIY数据科学

评论昨天的爱好者,皮特•格里菲思提供“自己动手数据科学”,我真的很喜欢那个建议,原因很多。

我认为数据科学和机器学习(我知道他们不是一回事)是一个非常大的技术创新在未来几年的一部分我也知道把强大的工具的“普通人”产生更多的创新比可能发生当数学家和科学家的工具是有限的。

博客出版革命是一个很好的例子一旦每个人都可以有一个印刷机,我们看到许多重要的发展没有,也不会发生只要出版是一个高成本的操作仅限于专业人员。

So what is the Tumblr or Blogger or WordPress of data science? When will my son and his friends be able to take the NBA dataset and start running algorithms against it to produce better fantasy picks? When will my daugther and her friends be able to take the TV viewing dataset to decide what TV shows to go back and watch that they missed last year?

我相信科学的数据将在未来几年成为主流将实现的平台(s)?