有些人对于信息和数据的划分持有不同的观点。有些人认为信息就是数据,也有些人认为数据和信息不一样。他们这么说当然有自己的知识背景。对于从事计算机行业的人来说,信息和数据可能没什么区别,因为计算机就是以数据为基础进行运算的,数据就是计算的基本单位,自然对于计算机而言,信息就是数据。对于很多其他行业的人而言,信息有很多载体,比如文字,图片,语音等等,不太能够直接理解这些载体中的数据,所以信息和数据对于他们而言并不是同一个概念。
不过,现在很多行业也在面临一个数据化的过程,比如对真实世界建模,大语言模型等。由于数据能够从底层改变行业基础,相应行业的思维模式等内容随着数据化的进程势必也要发生比较大的改变。比如,原来的多模态可以用单一模式来表示,很多数据技术,比如超链接,压缩和解压缩,加密和解密会直接应用到行业的底层,可能会针对行业建立操作系统等等。
以法律行业为例。以前我们描述法律条文的时候用的还是比较形象化的语言,比如红线之类的,数据化之后可能就是某一个领域的边界或者是某个特异的指示,难以直接理解,或者是需要懂行的人来解释,当然也可以通过统一的转换器来进行理解;法律条文的丰富性不仅在于一个个具体条文,更在于相关联的一个个具体事例,数据化之后观察起来可能会更方便一些;法律的数据化的操作系统可能就跟目前的公检法司这个体系不太一样,会在更多的层面成立而与我们密不可分,更加倾向于服务而支持我们的生活,更加可移植可通用可开放而与更多人兼容。
当然数据化之后,也可能有更多的挑战,比如费用会更高,出错之后更麻烦,维护更困难等。对于我们个人而言,想要更好地面向这种挑战,还是要发展我们的能力,在更多维度上提升自己,从而发现我们的信息,同时也就是在发现我们的数据。