从统计和概率发帖

DIY数据科学实践

我写关于DIY数据亚博体育app下载苹果版科学的帖子回到三月。在那篇文章中,我说,黑客攻击公共数据集并发布它有可能在未来几年成为一件大事。亚博体育app下载苹果版我看到了一个很好的例子,正是我今天早上所想的。亚博体育app下载苹果版

阿拉斯泰尔库特从MTA提取了一堆转门数据了解高峰时段纽约地铁最常用的车站是什么.和他把代码发到了Github并将其嵌入到他的博客中。

如果我是高中数学老师,我会接受他的工作,把它作为一个项目,让我的学生一起工作。MTA制造有很多可用的数据.这种东西与纽约市的青少年关系密切。他们会理解数据和练习。

做DIY数据科学的数据和工具变得越来越容易获取。我希望我们都能参与到数据黑客活动中,并开始在公开场合就这些东西展开合作。至少,它将导致更多的数据科学家,我们可能会同时学习一些关于我们自己和我们的世界的有趣的事情。亚博体育app下载苹果版

顺便说一句,联合广场是高峰期最活跃的地铁站。中城南自由贸易区!

DIY数据科学

对昨天业余爱好者帖子的评论皮特格利菲斯提供了“自己动手做数据科学”,我非常喜欢这个建议,原因有很多。

我认为未来几年,数据科学和机器学习(我知道它们不是同一回事)将成为技术创新的重要组成部分。我也知道,把强大的工具交给“凡夫俗子”会产生比仅限于数学家和科学家的工具更大的创新。

出版业的博客革命就是一个很好的例子。一旦每个人都有了印刷机,我们看到了许多重要的发展,只要出版是一项仅限于专业人士的高成本业务,就不会也不会发生。

那么,数据科学的Tumblr、Blogger或Wordpress是什么?我的儿子和他的朋友什么时候才能拿到NBA数据集,并开始运行算法来产生更好的幻想选择?我的女儿和她的朋友什么时候才能用电视收视数据集来决定他们去年错过了哪些电视节目?

我相信数据科学将在未来几年成为主流。实现这一目标的平台是什么?