大数据的目的:生产小型数据

弱水三千,只取一瓢。如果拥有着一切,那么我只是需要能够解答我关心的问题的答案。

在这个例子中,解答我们关心的问题的数据信息,是从大型数据集中获得的。但是最终你的分析和结论,,都是采用了一个小型的数据集来完成(即是满足你搜索条件的五家餐厅)。

大数据资源的目的,就在于生产各种小型的数据集。没有什么解析工作是直接在大数据资源中进行的,大数据资源的使用一般仅限于搜寻和检索。大数据资源实际上通过各种方式收集和组织了大量复杂的数据,在这样的资源中,已经准备好了解答你的各种问题。当然,在未来,数据的生产者和组织者还有很多事需要做,例如如何辨别酒吧和餐厅?外卖店和餐厅有什么区别?那些数据应该被收集?如果发生了数据丢失应该如何处理?如何有效的保存数据等)

大数据很少进行全盘分析(当然,也有可能),大多数情况下,都是通过过滤,大幅度降低数据维度和数量,把大数据分成相对较小的数据进行。此规则适用于科学研究中的数据分析。

澳大利亚“平方公里镜阵”探路者

泛星计划(Panoramic Survey Telescope And RapidResponse System,Pan-STARRS)

大型强子对撞机

位于澳大利亚的“平方公里镜阵”,拥有七组全球级别的射电望远镜;欧洲核子研究中心的大型强子对撞机以及美国空军资助的泛星计划(Panoramic Survey Telescope And Rapid ResponseSystem,Pan-STARRS,直译为全景巡天望远镜和快速回应系统)

耀变体

做对的事情比把事情做对重要。

大数据的目的:生产小型数据

相关文章:

你感兴趣的文章:

标签云: