在日常生活中,我们经常会接到一些骚扰电话,有做房产推销的、有卖保险的,还有问要不要贷款的、要不要装修的,诸如此类,这些骚扰电话让人很厌烦。同时,也让我们心生疑窦:是不是自己的电话号码又被房地产开发商给卖了?这些人是怎么知道我们的电话号码的?说到底,这种现象揭示了数据保护的重要性和数据的外部性。

数据保护就是指与我们有合作关系的企业或机构应当有责任保护好我们的个人隐私数据,比如:在房地产销售中,甲方指房地产开发公司,乙方为购房人或购房机构,此时甲方有责任和义务保护乙方的个人隐私数据。而数据的外部性则是我们今天要重点谈一谈的话题。
数据的外部性是指某些数据对于甲乙双方之外的第三方具有价值。数据的外部性可分为表现型外部性和事实型外部性。表现型外部性是指某些数据理论上说对第三方是有潜在价值的,但第三方没有真正获得数据、没有形成利用数据的事实;而事实型外部性则是指第三方得到了相关数据,并将某些数据实际利用于商业用途、获得事实上的价值了。
仍以个人数据为例,普通消费者(乙方)与甲方构成事实上的买卖关系或合作关系后,乙方成为了甲方的客户,此时乙方的个人数据应当仅限于甲乙双方之间有业务互动时方可使用,且甲方应当有义务保护好乙方的个人隐私数据。但是,有些第三方机构或个人在觊觎我们的数据,发现利用我们的数据可以做很多事情,他们利用我们的数据是有利可图的。于是,就有第三方就不惜铤而走险,通过各种不法手段获取我们的隐私数据。这样原本属于封闭系统内的、只限于甲乙双方范围内的数据,因为它们对于第三方有价值,就被第三方用非正常手段获取了,事实型外部性就这样形成了。
根据以上分析,可以看到:数据表现出外部性是很正常的现象,这是由数据的自然属性决定的。数据的外部性具有补充信息、消除信息不对称等作用,往往对于第三方具有吸引力。外部性天然就是与隐私性是对立的,但是,如果利用非合规的手段把数据的外部性做成事实的话,则是违反国家信息安全法规的。
是不是所有的数据都有外部性呢?个人理解是:并非所有数据都具备外部性,数据的表现型外部性和事实型外部性都需要满足一定的条件才可以形成,也就是数据在特定条件下才会对第三方有价值。举个例子来说,假定我们的车辆保险到8月底就到期了,我们之前是和中国人保签的保险服务合同。从5月份开始就有各种非人保的电话来询问要不要上保险、要不要先看看报价。这时,我们之前的保费信息、个人车辆数据等对于非人保的第三方来说已经呈现出了潜在价值。但当第三方获得的不是准确有效的数据,或者不是有价值的数据时,这个潜在价值就不一定能变成事实上的价值。而且,当某个第三方(比如:平安车险)已经被乙方屏蔽了的时候,这个第三方也就失去了即使拿到了用户的车辆信息和电话号码,也无法实现事实上数据价值,因为它根本无法触达用户。可见,要实现数据的外部性还是需要一定的触发机制的。
根据以上分析可知,数据的表现型外部性是自然形成的,数据的事实型外部性则需要通过一定的手段、在特定条件下才能实现。那么,如何才能实现数据的事实型外部性呢?个人认为有三个要素:高度相关性、有场景和需求、获得并利用数据。
其一是高度相关性。作为第三方,首先必须是甲乙双方有一定关联度的,八竿子打不着的第三方一般对甲乙双方间的数据是没有需求的。比如:某人刚买了一套房子,在快收房之际,很多第三方的装修公司纷纷致电,寻求房屋装修的合作机会。装修公司作为第三方,其与甲乙双方的关联在于房子,房地产开发商卖房子,业主买房子,装修公司来装修房子,房子就是三者的共同交汇点。装修本身就是与业主和房子的数据有高度相关性的。
其二是有场景和需求。一方面是乙方有需求,另一方面也指第三方有需求。还是以装修房子为例,装修房子就是应用场景,收房后业主普遍有装修房子的计划,除非他暂时不想装修房子或者房子不需要装修。同时,装修公司也是想找更多的生意,当然除非他们是在忙不过来时他们就没有这方面的需求。业主和装修公司都有装修房子的需求,此时只要能用数据将业务和第三方装修公司连接起来,那么,数据的外部价值就有机会发挥出来了。
其三就是获得并利用数据。前面所说的高度相关性、有场景和需求,只是能形成数据的表现型外部性。要想形成数据的事实型外部性,就需要获得并将数据利用于商业场景中去。继续延续前面的例子,当房地产开放商中有人充当内鬼将业主信息卖给装修公司时,此时装修公司就有机会挨着个打电话把即将收房的业主骚扰一遍了,运气好的就会赢得一些商机和订单。如此这般,个人隐私数据在未经乙方(业主)允许的情况下,被房地产开发商(甲方)或者其内部人员卖给了第三方(装修公司),第三方(装修公司)获得了业主数据并利用这些数据推销其装修业务、谋取商业利益,数据的事实型外部性就这样实现了。

数据的外部性从根本上说还是指数据的跨界价值。数据的跨界应用并非什么新鲜的事情,大约14年国内电信运营商就开始谋求数据的对外商业变现,而且在交通、旅游、征信等领域取得了不错的成绩。近两年,国家电网也在积极探索电力大数据的跨界运营与价值变现。BAT等大公司在数据对外变现上更是走在了前列。可以说数据的跨界运营是一种新趋势。但是,数据的跨界运营并非易事,不仅需要合法守规,还需要构建合理的商业模式。如何合理的利用数据的外部性进行商业价值变现呢?笔者认为至少需要做好三个方面:数据脱敏与用户授权、产品与服务设计、合理的商业模式。
1、数据脱敏与用户授权。利用数据的外部性时要做到合法合规,这是数据价值跨界运营的基础和底线。对用户的敏感信息需要进行必要的脱敏处理,在调用用户个人信息时需要获得用户的授权。以电信运营商的数据价值对外变现为例,他们对底层数据进行清洗和脱敏,使其从技术层面彻底杜绝了数据外泄的可能,而且模型的研发和测试均部署在自身的大数据平台上,向外部客户仅输出模型运算的结果,并对敏感信息进行处理,做到了原始数据不出机房。再比如:滴滴打车APP就是一个很好的利用数据进行商业服务的产品,它将用户的手机号码进行了转化,当滴滴司机与用户进行通话时,司机所拨打的是经过处理后的一个虚拟的号码,但是能实现与乘客的联系和沟通,而且这个虚拟的号码在打车订单完成后一段时间就失效了。这样也能很好的保护用户数据。
2、产品与服务设计。利用数据的外部性进行变现时产品与服务的设计也很重要。比如:电信运营商将用户数据跨界运营到交通和城市管理领域时,所输出的都是群体性分析数据和指标呈现,完全没有针对单体用户的针对性分析。这个就很好的规避了数据隐私和信息安全的问题。再比如:在银行或互金公司查询贷款人的征信数据时,一般都会调用第三方征信公司的数据接口,第三方征信公司就是将用户的征信数据封装为API接口服务的形式,对每次接口调用进行计价和收费。将数据进行API化也是数据外部性的一种很实用的服务形式。
3、合理的商业模式。做好了数据脱敏和产品设计还不够,如果想要将数据跨界运营长期化,必须要有合理的、可持续的商业模式来作保证。以同盾科技为例,他们的反欺诈产品之所以能够在国内市场上占有一席之地,很大程度上与其商业模式有关,他们的反欺诈产品就像是一块磁铁,每一次进行黑名单比对时就会对原有数据库进行一次更新迭代,如此一来接入的外部合作客户越多,其黑名单数据库就越强大,其产品和服务的竞争力就越强,反过来就能更好的服务于行业客户,赢得更好的口碑,形成滚雪球效应。这种典型的磁铁式商业模式就是同盾科技在反欺诈领域越做越强的秘密。
以上就是今天关于数据外部性的一些思考,暂时就能想到这些,后续如有新的思考再补上吧。就到这里。
免责声明:本文版权归原作者所有,文章系作者个人观点不代表蜗牛派立场,如若转载请联系原作者;本站仅提供信息存储空间服务,内容仅为传递更多信息之目的,如涉及作品内容、版权等其它问题都请联系kefu@woniupai.net反馈!
]]>数据的时空观是我们认识数据价值的一种新角度,它研究的是数据在时间和空间两个维度上的价值规律与作用机制,那么该如何理解数据的时空观?之前谈过数据的价值观,今天想谈一谈数据的时空观。

说到时空观,好像也是大数据领域比较忌讳的。因为一说到时空观就要扯到相对论了,在大数据领域来聊相对论的话题,大部分专家是不敢搬起石头砸自己的脚的。
没关系,反正笔者是大数据领域的一个小角色,胡说八道的聊几句,也不会掉自己的身价。
所以,今天笔者就打肿脸充胖子,在这里说说自己对数据时空观的理解。
开门见山,先说说什么是数据的时空观。
笔者认为:数据的时空观是关于数据在时间和空间两个维度上的价值规律与作用机制的基本看法与认知。这里提到的数据是一种宽泛的说法——既包括传统的结构化数据,也包括音视频、文本等非结构化与半结构化数据。
由以上定义可知,数据的时空观要研究的是数据在时间序列和空间位置上价值变化规律。
时间和空间本身就是人类认知世界经常分析的两个维度:时间和空间一方面可以对应到数据的纵向深度和横向广度,另一方面还可理解为数据在三维立体世界中的生命力,数据的时空价值本身就是数据生命力的体现。
时间赋予数据以温度。
绝大部分数据是有时间上的延续性的,随着时间的推移,数据的温度或热度也随着变化。越是久远的数据,其“体温”就越低,而此时此刻的数据则是鲜活的,新鲜出炉的数据就有较高的温度。
企业根据数据的温度差异,可以对不同温度的数据进行差异化处理。
比如:在用户画像领域,可以将用户的数据分为冷数据、温数据和热数据三种类型。
商业领域,数据价值一般随着时间的流逝在衰减。
艾宾浩斯遗忘曲线告诉我们,遗忘是人类的天性,时间越久远的事物,人类大脑能记住的就越少。
而在商业领域,随着人类采集和存储数据的技术日益成熟,数据存储成本的快速降低,需要人类大脑记住的数据反倒越来越少了,数据的记忆工作大部分都交给了电脑、云盘、服务器等工具。
随着时间的推移,数据量在增加,数据存储成本也在增加。
但是,从数据价值的时效性来看,越是新鲜的数据其价值一般会越高,而同样的数据如果是半年前的,那么其价值就会大打折扣。伴随着时间的流逝,数据的价值一般呈衰减态势。

在某些特定领域,时间能为数据主体带来增值。并非在所有的领域,时间都会让数据及其主体的价值产生衰减效应。
比如:一些古董或考古文物,对于此类物品有浓厚兴趣的玩家,其年代越久远,物品的价值就越高。
数据此时虽说只是一种记录或者证明,但是数据珍藏的时间越长久,承载数据的主体其稀缺度就越高,在市场上的估价就越高。
再比如:在很多悬疑侦破类电视剧中,很多历史上的案件因为缺乏实际有效的证据而被搁置为悬案。此时历史上的证明资料,可能就是一段视频文件,这些视频资料的数据因其重要性和难获得性,其对于案件侦破的价值就显得非常高。
当然,还有一些经典的影像资料、音乐作品、艺术作品等,这些作品及其所承载数据也是随着时间的流逝而会呈现价值增值的。
数据的时间价值是相对的。
价值本身是一个相对的概念,数据在时间维度上的价值也是相对的:一方面与数据本身的价值有关,另一方面也与个人或组织对于数据本身的感知有关。
数据的时间价值是有人文情怀在起作用的,所谓“如人饮水,冷暖自知”,同样是一段小时候的个人视频记录数据,每个人在不同的年龄段去打开观看时,可能会有不同的体验。
所以,对数据价值的体验与个人或组织的经历、状态等都有关系,数据的时间价值因人而异、因事而异。
空间赋予数据以距离感和亲疏度。
按此角度,数据可粗略分为:远距离数据和近距离数据。
同样的数据对处在不同空间位置下的企业或者个人,其影响度是完全不同的。一般来说,距离越远,数据的鸿沟越大,信息的不对称就越严重。
具体来说,数据在空间上的变化体现在两个方面:物理距离和业务距离。
1)物理距离
指在地理位置上或者经纬度上的差距,这个是在客观世界里的真实存在的距离。
比如:如果你身在新疆地区,同样是新增10个新冠肺炎确诊病例,在新疆地区的人对这个数据的感受与身在北京的人是不一样的,对于身在疫情重灾区的美国的留学生来说更是不一样。
可见,数据所反映事物的影响力与我们当前所处的空间位置有一定的关系,当然也与接收数据的主体对事物的关心程度有关系。总体趋势是物理距离越近,数据的价值或影响力就越大。
利用物理距离可以圈定电子围栏,锁定围栏中的目标用户可以进行精准“打击”。
比如:美团和高德地图软件中都有“附近”这个选项,进入其中就能发现距离当前位置最近的商户信息,此时如果客户有订餐或就餐需求,就可以选择距离较劲的、符合自身口味的餐厅去就餐。
同样道理,美团或高德也可以在APP端推送餐厅的信息给围栏内的客户,为平台上商户进行*流。
物理距离越近,与客户越亲近,为客户提供的服务就越容易获得,客户消费就越便利,这对平台、商户和客户都是有好处的,这其中数据实际上拉近了商户与客户之间的物理距离。
数据离客户或商家越近,其价值就越高。

2)业务距离
一般是指商业领域里数据与业务之间的距离,更具象化的说法是某项指标如果属于前端业务领域的,那么它就离业务比较近,如果属于后台部分的,那么它可能离业务的距离就比较远。
比如:订单量、销售额这样的数据离业务比较近,对业务人员的价值或影响力比较大,而员工在职人数、会议次数等数据则离业务比较远,对业务人员来说没有多大的价值。
一般来说,某项数据离实体业务越远,其在企业内的重要性就越低,其价值也就越低。

在某些领域,物理距离反而能增加事物的神秘感和探索价值。都说距离产生美,有时候距离也能产生价值。
比如:对于太空迷和天文学家来说,遥远的太空和外星球是很有吸引力的,有关外太空的深度数据因其稀缺性和难以获得性,对于太空迷和天文学家是很有价值的。
所以说,在太空探索等特殊领域,物理距离是无法逾越的障碍,但是物理距离反而可以增加太空的神秘感和探索价值。
借助AR/VR技术可以缩短外太空与人类之间的距离,让我们能产生身临其境的感觉。可以预见,在5G与AI技术加持下,物理距离将不再是限制事物释放数据价值的障碍了。
时间和空间本身是数据的两个维度。
在现实生活中,实现物理空间的跨越往往需要时间,而数据从一个位置传送到另外一个位置时通常是瞬时完成的。
所以,数据可以节省现实世界里实体的空间变化所耗费的时间,也就是用时间换取空间,数据给到了合适的人手中,物理空间上完成了转换,数据价值也完成了传递。
用时间换取空间的例子很多,比如在泰国高分神剧《天才枪手》中,小林想到的跨时区作弊方法,就是利用了SAT考试在不同时区的时间差,在这个时间差内完成考题答案(数据)的空间传输。
小林先去澳大利亚参加考试,把所有的考题和答案背诵下来,然后通过藏起来的手机将答案(数据)传送,老板们通过铅笔来把答案带进考场铅笔上有不同的条形码粗细代表各不同的选项,而旁边的数字就是填空题的答案。
一场完美的作弊就是这样完成的,虽然实际执行过程中出现了一些意外情况。
总之,数据价值可以实现时间和空间的转换,数据在时间维度的价值可以转化为在空间维度上的优势。
在适当的场景下,空间维度的价值也可以转化为时间维度的价值,这就是数据价值在时空上的统一与转化。
数据同时在时间和空间上的积累,最终能演化出什么样的价值呢?
笔者认为,数据在时空上长期的积累至少能证明我们做事情的专注和坚持,这无论对个人还是企业来说,都是一笔可贵的财富,世上没有白走的路,每一步都算数。
正如《西游记》中唐僧不远万里赴西天取经,正是因为佛祖看到了唐僧师徒经过了九九八十一难的数据积累,正是因为佛祖看到了唐僧师徒四人17年(时间数据)跨越了千山万水(空间数据),才最终给唐僧下发了经书,唐僧等人才得以修成正果。
在《西游记》中,数据在时空上的价值得以具象化,最终换取了佛经和正果。
数据同时在时间和空间维度上都有变化时,数据将呈现怎样的状态呢?
此时,数据可视化将会告诉我们答案。
比如:天气预报充分融合分析了天气相关指标的时空特性,是时空大数据产品的典型代表。
综上所述,数据从时间维度来看是有温度的,从空间维度来看则是有亲疏度的。
通常情况下,数据离我们的时间越长,离我们的距离越远,数据的价值就越低。由此,引出了另一个话题,那就是数据的取舍。
既然数据的价值跟时间和空间有关系,那么那些时间上离我们很久远的、距离上离我们比较远的数据就是垃圾数据,也就是价值不大的数据,这些垃圾数据经年累月的积累下来,就会占据大量的存储空间、耗费大量的存储成本。
在数据爆炸的今天,我们应该学会对数据进行适当的取舍了,是时候要放弃一部分低价值数据了。
对于企业来讲,做数据资产管理不可贪多求全,适当放弃低价值数据方是正途,建议企业应该更加重视与业务距离较近的热数据,而对与业务距离较远的、非热数据应采取有选择性的放弃策略。

数据的时空观是我们认识数据价值的一种新角度,它研究的是数据在时间和空间两个维度上的价值规律与作用机制。
时间赋予数据以温度,将数据分为冷数据、温数据和热数据。
从数据价值的时效性来看,越是新鲜的数据其价值一般会越高;空间赋予数据以距离感和亲疏度,将数据分为远数据和近数据,总体趋势是物理距离或业务距离越近,数据的价值或影响力就越大。
数据在时间上的价值与空间上的价值有时是可以相互转化的——数据价值在时空特性上可实现统一,可以具象化和形象化。在数据爆炸的时代背景下,企业应懂得数据的取舍之道,学会有选择性的放弃低价值数据。
以上就是我对数据时空观的粗浅看法,我在这里等候各位专家拍砖过来。
免责声明:本文版权归原作者所有,文章系作者个人观点不代表蜗牛派立场,如若转载请联系原作者;本站仅提供信息存储空间服务,内容仅为传递更多信息之目的,如涉及作品内容、版权等其它问题都请联系kefu@woniupai.net反馈!
]]>