
比如最近火热的智能硬件。戴个手环,戴上一副眼镜,收集了很多数据,但是把数据拿回来后,总觉得没用,无法分析。例如,如果你戴上眼镜,人们平时可以用眼睛看东西。除了每天 24 小时闭着眼睛睡觉,他们把能看到的所有东西都收集起来,但这些有什么用呢?我们想了想,但没用。
国家有关部门的卫星拍摄了大量的卫星图片李彦宏,数据量也非常非常大。百度做地图,其实这些东西我们也研究了很久。想了想,觉得我们不能用这个数据。那么它们并不是每个人真正需要的。拿一个手镯,数一下我走了多少步,燃烧了多少卡路里,每天有多少次心跳。它可以帮助治愈我的疾病吗?我也问过很多医生,他们也说这个东西没有用。
我认为下一个方向实际上是新数据。就是思考什么样的数据能够真正帮助人们解决问题。今年4月1日,我们谈到了一个概念产品,百度筷子搜索。很多人问你什么时候发布这个产品,我们要买它。实际上,我们还没有这样做。但是,这东西确实代表了方向。当我们说你有一双筷子的时候,你吃这道菜的时候就可以知道这道菜里有没有地沟油,或者这种蔬菜是否超过了重金属的限量……那大家就会觉得这东西太有用了,我想要这个东西。
目前,这些数据不可用,我们也没有能力收集这些数据。但这确实代表了一个方向,因为你每天都吃,每天都用筷子。不是你不戴手镯,而是你戴上它。你不戴眼镜,但你戴的这个很重的东西完全不同。我做我已经做的事情,同时帮助我收集数据,这些数据可以立即告诉我一些有价值的信息;或者这些数据可能不会立即告诉我什么信息,他们立即告诉我的不一定有价值,但是,如果我坚持下去,也许它会有价值。
就像中医的概念是“治未病”,就是告诉你在你没有生病的情况下,你的身体将来会发生什么。许多疾病有一个漫长的积累过程。在这个积累的过程中,你身体的各种指标肯定是在变化的。但是,目前的医学实践是说,当你生病了,或者你认为自己有病的时候,去医院检查,希望在几个小时内,最多几天内就能诊断出问题所在。而这种真正能治人的“预防性”或更高级的治疗,是很多症状多年的积累,在积累的过程中,因为你连续(监测)你的身体特征长达三年之久或一个月或六个月,你可以知道我今天的身体数据和六个月前的区别。可能是身体有问题,需要尽快去医院。这不是“快数据”,而是“慢数据”。“慢数据”对消费者来说可能有很大的价值。而这种“慢数据”的收集方式,并不是来自原本不需要佩戴的东西,一定是你平时在做的事情,这些数据都是顺便收集的。例如,我必须每天刷牙。在刷牙的过程中,我的唾液可以被触摸和分析。也许如果有一种癌症,它可能会比唾液检测到五年前被现代医学检测到。经过六个月的连续检测,您就可以知道可能会发生癌症。如果收集到此类数据,
所以我认为新一代的数据采集,无论是采集工具还是数据本身,都会有很大的发展。但在这里,难点不在于你制造一种新型硬件,而在于你能找到那个点,找到对人们有价值的数据。
事实上,健康领域的大数据已经被谈论了很长时间。例如,对于人类基因测序,过去很多国家都从纳税人那里花费了很多钱来开发这张人类基因图谱。现在成本大幅下降,几天之内检测整个人的基因可能要花上千元。从理论上讲,这个数据也可以告诉你,你的身体会发生什么,有什么特点,未来会有什么风险。但从本质上讲,数据仍然是无用的。因为本质上是ATCG,所以基因的序列是用ATCG来排列的。你看到的是一串 ATCG,可能会重复很长很长的距离。我们今天谈论的很多大数据就是这样的数据。但是这样的数据是没有用的。我们有很好的技术,但我们无法处理这种数据。找到有价值的数据需要的不仅仅是技术。技术很有价值,但在这里不是最关键的。最重要的是什么?最重要的是(领域知识)、你的(经验)和跨领域思考的能力。如果你真的是懂网络的中医,你可以研究一下,拿出一个指标。连续六个月(跟踪)后,就可以知道哪些疾病会发生或不会发生。这是纯互联网公司做不到的。需要该领域的专业知识甚至经验。还有跨领域的思考。能想到这些事情的,可不是一个简单的医生。你一定有互联网的思维。你可能不知道这项技术是如何实现的,但是您需要知道这些东西可以在技术上实现。只有这样才能找到正确的数据。










