当前位置:  首页 > 赛车科技

华傲数据贾西贝:数据无界 数据应用有界 隐私保护立法严苛但不详细

2018-05-21 01:25:00来源:北京赛车官网

        作为一家大数据效劳提供商,“华傲数据”刚刚取得C轮融资,华傲数据分离开创人CEO贾西贝博士日前在“西丽湖科技金融大讲堂”发扮演讲,以为目前已进入大数据+人工智能的风口,政府部门对隐私维护虽严苛但不细致,应该细化法律维护,厘清数据应用边境。据了解,贾西贝在大数据方面从事多年的科学研讨,在国际顶级数据库会议和学刊上发表了多篇论文,是国度“千人计划”特聘专家。

  观念摘要:

       1、数据是什么?假如用国度的定义,数据是基础性战略资源。

        2、数据能做什么,一枚硬币有两面,数据这枚硬币也有两面,第一面刚才说了,数据能发明很多价值,华尔街的人都有失业的可能。

         3、科学无国界,但是科学家是有国界的。我就把这句话套用过来,数据是无界的,但是数据的应用是有界的,需求管理和监管。

        4、假如金融的实质是风控,风控的实质应该是大数据。

  以下为贾西贝演讲实录(该实录经演讲者自己核对并受权本报首发):

  人工智能这一波潮和数据的积聚密不可分

  贾西贝:大家好,我叫贾西贝。今天咱们是资本市场学院,在这儿我觉得应该感激这个时期,这是一个有风口的时期,让我能从一个研讨者变成一个创业者。今天也见到咱们的投资机构,像刚才的东方富海、国度中小企业基金、深创投、深投控等投资机构,所以有时分说创业是一个很有魅力的事,从做研讨到创业痛并快乐着。其实我原来的研讨方向是数据库的原理和系统,咱们公司的主要业务是在数据管理,特别是政府数据管理方向上。在金融方面也是十分需求数据的,特别是最近把数据和人工智能分离起来,在金融上有一些新的应用分享,好多公司都在探求,咱们也是探求中的一家公司。

  

  我今天讲的是两个方面,一个是大数据和人工智能在金融应用方面的探求。由于今天的主题是“金融科技和金融监管”,咱们做数据会对金融监管相关的数据监管和技术监管有一些体会,也和大家做一个交流。

  第一,大家都知道人工智能这一波潮和数据的积聚密不可分。前几年的时分大家讲大数据,都讲3V、4V、5,我回过头来问一个很傻的问题,数据是什么?可能一千人有一千个回答,但其实是有一个权威答案的,由于咱们国度在2016年有一个国度大数据战略,这是在十八届五中全会的时分决议下来的。数据是什么?假如你用国度的定义,数据是基础性战略资源。

  不只是咱们中国这么定义,大家看美国的《大数据研讨展开计划》,在数博会上李克强总理的讲话,习主席2013年在中科院的讲话,这几个提法实质上都是一样的,是工业社会的自由资源。特别是习主席讲,谁控制了数据谁就控制了主动权、谁就控制了未来。奥巴马说大数据是未来的“新石油”。最近一次习主席在中央政治局学习时的表达是,大数据是数据经济的关键要素。这一块就触及到金融科技里面用的比较热的几个技术,这里面和咱们相关的就是大数据、区块链、人工智能。

  人工智能是吃数据的

  首先数据是一种资源,或者是一种消费资料,按国度政策说是基础性战略资源,那区块链是什么?区块链链圈的人,我有好多链圈的朋友,大家张口就说区块链处置的是消费关系的问题,处置了怎样在散布式情况中保证透明、保证反窜改,保证公平这样一些事情。区块链处置的不是提升数据处置效率的问题,以至于在区块链的买卖里一秒钟大约7笔买卖,当然往常有很多改进。咱们原来的研讨方向有散布式数据库,散布式账本实质上不是散布式数据库,更多处置的是消费关系的问题,它不是处置数据库怎样访问快的问题。人工智能是什么?人工智能是吃数据的,它吃了数据这种消费资料提升了效率,所以处置了消费力的问题。

  敏感数据自然难以买卖

  特别是人工智能,大家说人工智能的要素,原来说算法、算力和数据,往常有人讲ABCD,A是算法(Algorithm),B是业务场景(Business Scene),C是算力(Cloud)、D是数据(Data)。ABCD里面,目前假如做人工智能对它们的需求可能是不一样的,A和C是能够买的,技术是能够买的,实践上人工智能,随着算法的成熟、随着挖人大战的中止,A是能够买的。C更能够买,AI芯片是能够买的,很多算力是能够租的。B和D是比较难用钱处置的,特别是D。D有时分一买就违法了,这里面有个人信息维护的问题。后面我能够分享这个主题。敏感数据自然难以买卖,而真正有用的数据绝大多数都是敏感数据。

  大数据+人工智能改动这个世界是同步的

  大数据+人工智能正在改动咱们的生活,这里面大家看到是国内特别热的无人驾驶汽车、机器人,包括咱们熟习的人脸辨认、语音辨认,也包括咱们不太熟习的机器人(智能)医生诊断、机器人(智能)律师和法官判案。原来开端华尔街写报告的时分,有人说人工智能这一波潮,机器换人改动了工厂的状态,东莞的工人要失业了。最后看到东莞工人失业的同时,可能不是前后脚,以至是反过来,华尔街的人先失业了。高技艺的医生、律师、投行人士未来可能跟东莞的工人是一同失业的。所以咱们看到大数据+人工智能改动这个世界是同步的,是在各个角落里改动这个世界。

  大数据的世界里人是没有隐私的

  我是做数据的,做数据的人可能天生会看到一些趋向,比如在大数据的世界里人是没有隐私的。比如人脸辨认,有一个很有趣的例子,往常家里的监控摄像头未来可能都有人脸辨认的功用。比如说一个独栋别墅,在一个街边,它的门口监控摄像头对着门的里面是没有问题的,对着门的外面呢?假如这个摄像头更明晰一点,一切过这条街的人都被辨认了,能知道每个人在这里走几次,这个有没有法规说允许不允许。所以,新技术让数据的获取的广度大大提升,人的隐私遭到了史无前例的冲击。

 

  另外一个可能往常还没像人脸炒得那么热,这个叫脑机接口,有的也叫脑控。前面我在一个公司体验脑控的无人机,我想让这个无人机翻跟头就翻跟头,我想让它往上飞就往上飞,但脑控的另一面其实是对脑电波的了解,换句话说,原来说测谎仪,要发挥狂野想象的话,脑机接口技术能够让测谎的场景变成读心术,假如人的心机都能被读出来,不只是测谎,不只是人的脸能被辨认出来,所以数据获取的广度史无前例的多。在这样一个世界里,数据能做什么,一枚硬币有两面,数据这枚硬币也有两面,第一面刚才说了,数据能发明很多价值,华尔街的人都有失业的可能。当然经过AlphaGo这个事情大家都看到了数据+人工智能的能力,到AlphaZero的时分,这个时分曾经不用那么多的锻炼数据集。

 

  比如说高盛600人的股票买卖团队,逐步被机器人取代到只剩2个人,这可能比东莞的工厂还激进。美国摩根大通银行用自动机器几秒钟替代之前内部律师需求36万小时完成的工作量。德意志银行用机器算法买卖员替代纽约的衍生品买卖员等等,这样的事情正在发作。

  数据无界 数据的应用有界

  

  大数据和人工智能史无前例地深化到生活的每一个角落,这里面其实有监管的事情。咱们看到大数据杀熟,咱们看到大数据上的引荐算法用于内容引荐惹起三俗的问题,咱们看到大数据上的偏好剖析用于政治范畴的精准竞选惹起的问题招致扎克伯格买了九个版面来为个人信息泄露负疚,咱们老一辈科学家经常说,科学无国界,但是科学家是有国界的。我就把这句话套用过来,数据是无界的,但是数据的应用是有界的,需求管理和监管。

 

  金融监管要探求数据应用和科技应用的边境

  我再多套用一句,今天是金融科技的论坛,科技无界,但是科技的应用有界,需求管理和监管,这个边境在哪儿?所以我个人了解金融监管的一个重要内容就是要探求数据应用和科技应用的边境。比如我熟习的数据范畴,数据最成熟的一个范畴是精准营销,也发明的庞大价值。但是再往前走一步,大数据杀熟也是一个精准营销,这个就有道德风险,且有违背《消费者权益保证法》的嫌疑。

  能抵御诱惑又赚钱的创业者最不容易

  再往前走一步,大家看到前一段今日头条张一鸣不是说睡不着了吗,抖音、快手等也用引荐算法,实质上也是精准营销,是内容的精准营销。当咱们推行商品的时分用大数据+人工智能没问题,当咱们推行内容的时分,有时分科技遇到监管的时分也是比较脆弱的。

  再往前走一步,咱们看到前些年,特别是往常传销、电信诈骗、金融诈骗,背后都有大数据的火上浇油。所以数据应用的边境究竟在哪儿?当没有监管的时分,实践上是考验人性的时分。所以,有时分我说当创业者不容易,当个赚钱的创业者更不容易,最不容易的是当一个能抵御诱惑的赚钱的创业者。大家看到整个金融各个赛道里,很多时分就要抓一个政策真空期,在这个真空期里面能不能快速积聚财富,这个时分没有监管引路的时分,对人性的考验是庞大的。

  监管紧跟金融创新比较好

  所以创业需求动心忍性,我是研讨转创业,所以想得比较多,可能我想多了。但是这个里面我觉得金融监管的步伐不要比金融创新的步伐晚得太多,跟着就比较好。晚的太多,由乱到治,在政策真空期更多靠自律,人不时禁受诱惑,人性不时禁受考验。这其实不是一个好事。

  再看下一个,大数据能够做精准效劳,咱们国度提精准扶贫,在公益里面大数据能够发挥作用。精准公益行不行呢?有些精准公益,可能一定能够。假如再往前走一步,在宗教上能不能用大数据呢?可能是很难的。

  等候技术和数据的“万里长城”

  最后一个就是扎克伯格的问题,在政治上能不能用大数据,中止精准竞选,所以Facebook这次最大的罪恶是突破了把数据用于政治的底线,影响了全球200多场选举。大家想一想,中国当然还没有这么严重的事情,假如有会怎样样。所以科技和数据应用的界线,科技和数据范畴一日千里,这个界线是很难肯定的。所以这个时分它的边境在那儿?当咱们做初次代币发行ICO的时分,当咱们对币圈、链圈有不同态度的时分,咱们又要做数字货币的研讨,这个边境在哪儿?我觉得是一个既考验人性又考验政策的事情。中国有万里长城,咱们也希望在金融监管这块对技术的应用、对数据的应用有一个“万里长城”作为边境。

  大数据立法刻不容缓

  其实前面我在中国政法大学第一次中国大数据法治论坛上,就呼吁大数据立法刻不容缓,所以数据能干什么,给大家念一下:到2017年12月30日,全年公安机关当年累计侦破侵犯公民个人信息案件4911起,抓获立功嫌疑人15463名,打掉涉案公司164个。所以,数据监管应该成为金融监管里重要的不可分割的一部分。所以咱们应该让金融创新,在监管的框架下稳步前行。

  金融的实质是风控 风控的实质是大数据

  大数据+人工智能在投资范畴的应用,这个里面我不是金融出身的,咱们这个团队有一些金融方面的资深的人士,今天我班门弄斧。当然第一个是金融市场的预测,这方面大家看到彭博社等都有一些胜利的案例。包括风险信誉,其实不论古代靠人还是现代靠计算机,实质人和计算机的底层都是数据,假如金融的实质是风控,风控的实质应该是大数据。

 

  这样里面像2016年彭博社用机器学习模型来预测上市公司的财报,这个精确率居然能抵达60%,这个是超越预期的精确率,这里面也有日本三菱UFJ摩根的预测,抵达68%,是预测日本股市的走向,也是这些年的进步。其实这些事情自身是很难的。在瑞士信贷等等都做了很多经过大数据在金融投资这块的尝试。

  金融投资是大数据应用的一片沃土

  我前面讲了硬币的另一面金融监管,往常讲投资,这里有一个联络,其真实金融风控方面用的很多数据是敏感数据。我刚才不时在问这个边境在那儿,大数据能干什么。金融投资就有一个益处,金融投资更多运用开放数据,特别是在股市投资、在贵金属投资上。这里面至少在数据的监管方面,这个边境是比较容易看到的,而且边境是比较高的,大家能用更多的数据,都是开放数据、公开数据。所以这个方面在金融投资里面是大数据应用的一片沃土。

  这一块以某证券公司为例,2012年该公司的净利润42亿,假如采用二代算法利润能进步17%,智能投顾和量化买卖的算法;假如采用三代能进步26%,所以可俭省720亿的买卖本钱。这里面数据的应用和人工智能的应用有庞大的空间。

 

  人工智能在金融范畴不能一蹴而就

  但我切身的感受这不是一蹴而就的,在金融范畴里用大数据,大家往常说人工智能有几大风口,至少我了解不比在自动驾驶汽车用人工智能更简单,它不像人脸辨认、语音辨认,或者是声纹辨认,这个都能很明晰地定义出来,攻关了几十年,应用的场景比较简单,金融里有复杂的人的要素、有复杂的各方面的影响。所以我觉得在智能投顾,大数据人工智能在金融里面的应用也不会一下就突破,一下就取得辉煌成果。这是需求一步一步走的道路。

  咱们看到,假如说2012年是机器人投顾的原点,到2014年就滚了140亿美圆,从0点到140亿美圆,这是十分快的。有调研说机器人顾问管理下的资产在未来十年之内能涨到5万亿美圆,这有一个庞大的空间,也有一个十分艰难的路要走。固然国内对智能投顾逐步熟习,大家都看到这里面还是有很多不明晰的东西,需求咱们去抑止,包括政策层面的、监管层面的、技术层面的,也包括业务层面的。

  这里看这个数据都十分兴奋,2017年高净值人群是58万亿,算法买卖的有40万亿钱的买卖额,信誉市场也有超越12万亿,这里的确有庞大的空间。咱们看到大数据+人工智能在金融里面的应用,在国内也有十来年的历史,算法买卖执行的创新,在上面投资战略的产生,能更多应用人工智能、应用一些算法,是更高一级别。

  往常的智能投顾更多讲大类资产配置,资产配置效率的创新。最后假如再往下展开,以至包括金融行业的结构的改造,这个我了解是大数据和人工智能在金融投资这个范畴展开的四个台阶。

  智能投顾亟待呈现“一揽子”技术处置计划

  第三个方面我简单引见一下,咱们对智能投顾业务的探求。智能投顾业务一个重要的效劳是效劳咱们的私募基金,特别是证券私募基金,这里面咱们国度有2.22万亿的私募基金的实缴范围,其中私募证券基金管理人有8000多家。由于原来咱们国度有很多是靠内情音讯,或者是看一些新闻去做。从大趋向来讲,往常越来越依赖看这个公司自身。

 

  其实要打一个不恰当的比喻,我觉得很像智能手机来临这个时期,我还记着开端智能手机很难做,后来忽然有不到一年的时间就遍地开花了。为什么呢?由于有一个公司叫联发科,MTK,提供了芯片组“交钥匙”工程,一整套的,所以变成华强北的工厂或者说IT从业人员一两周就能做出一个智能手机。这时分在咱们往常证券私募大家都还比较关怀量化买卖和智能投顾的时分,咱们有没有一个像联发科能提供一个交钥匙工程“一揽子”计划这样一个技术处置计划。我觉得是市场所召唤的,也正是咱们目前正在提供的一个效劳。

  数据的深度和广度会对金融投资产生庞大影响

  所以这里面首先是用什么技术,用大数据技术、人工智能技术,特别是人工智能里面像自然言语了解、语音辨认。还有和大数据、人工智能、金融相关的学问图谱,经过这些来指导咱们的投资。传统用的比较多的是相关类、信誉类的数据,最近几年也比较热。特别是在投资范畴,和投资密切相关的信号类的大数据资产走势预测等等,有了这些数据能够做智能买卖、能够做战略开发,能够做大类资产配置,能够做FOF、MOM的管理,以至未来还能够做ABS,经过这四大类的金融投资的系统来支撑。

  刚才我讲到往常数据的获取的深度和广度,可取得的数据源史无前例的多。其实再说一个例子,其中法律的问题大家要自己来判别。国际上有人做石油投资的时分,租用了卫星监测全球大的炼油厂,每天进去几油罐车,出来几油罐车,经过辨认算法来计算,推进这个来预测油价的走势。在英国这样做的公司还是比较盈利的。

  假如咱们监测每个人去全国主要的证券买卖所,或者是在一些敏感部门,刚才我说人脸辨认能布在那儿的话,假如在街口布满了人脸辨认机器,就知道谁去了,大家去了几人,往常史无前例取得的深度和广度的数据对整个金融投资实践上也会产生很大的影响。

  未来金融大数据是给机器读的

  原来金融大数据更多是给人读的,未来这个时期可能更多要给机读,从人读变机读,对数据自身的请求和对数据产生速度的请求变得更高了,人读是读不过来的,机读需求更细粒度的数据,比如tick级别的,在一秒钟之内会有很多据,这也提出一些新的应战和一些新的请求。用这些数据来支撑智能投顾、量化买卖、FOF等金融投资系统。咱们这个团队也包括从高盛、瑞士信贷、JP摩根、中信证券等出来的金融专业人士,十分有幸我作为一个大数据方面的算法研讨者,能和这样一个团队一同把大数据和人工智能算法和金融的业务碰撞分离,构成一些创新,我觉得这是一个十分好的时期。

  华傲集中做数据清算工作

  华傲成立开端就是一个大数据公司,在2013年的时分还被《哈佛商业评论》评为引领中国大数据展开的三家中国企业之一,另外两家是百度和腾讯。

  咱们主要在数据清算这样一个范畴。这个产品,是给专业人士用的,S++是一个战略生成的产品,里面内置了一些人工智能的算法。这里面其实也要说一个,前面讲到AlphaGo,很多人问说人工智能、深度学习往常在智能投顾里真正的应用怎样样,由于这里主流的还是很多传统的数据剖析算法。

  比如说在日内买卖里面,日内买卖股票的买出卖出其实和AlphaGo的算法是有很大的相似性,很像下棋一步一步走,所以咱们也把这样的算法在实验室里面测过,假如用到往常私募这种基金的投资上,在股市上,能在原有的年化收益率基础上其实能够致少增加百分之二三的收益率。由于它不改动原来的投资战略,所以也是能够大范围应用、十分有前景的一个技术。包括在中期、长期的投资战略的选择上,往常一些人工智能的算法也能起到不小的作用。应该说还是在快速展开、不时突破的时分。综合起来,可能能取得更好的收益。

  华傲在国内独立大数据公司中专利最多

  后面是咱们公司的一个扼要引见,所以要感激深圳市、广东省政府,咱们也是广东省引进的“珠江计划”科研团队,也是深圳“孔雀计划”创新团队。咱们比较注重技术和学问产权,目前据我所知应该是国内独立大数据公司专利申报最多的企业,咱们申报了200多项发明专利,50多项国际专利,咱们也参与了十余项国度规范的制定。其实数据应用的边境,一靠规范来勾勒这个边境,二靠政策、三靠法律来。

  欧盟数据维护条例

  咱们知道像欧盟GDPR《普通数据维护法案》今年5月25日要开端实施,其实这个有争议性的法律关于整个数据行业的影响会十分深远。这里面包括属人准绳的引入,可能会使咱们一切在中国、经过互联网提供效劳的企业只需操作了任何一个欧盟公民的个人隐私数据就要恪守欧盟这部法律,所以它突破了国度的边境。往常经过互联网提供效劳的公司这么普遍,比如说腾讯、百度、阿里、京东、摩拜、滴滴等等,大家想去欧洲去展开业务,或者是没去欧洲展开业务,都要恪守这样一部法律,这个法律规则还是很细致的。

  中国隐私维护严苛但不细致

  咱们国度当然也很关注隐私问题,2017的《网络安全法》和《刑法》第253条的司法解释,使咱们成为国际上个人数据维护立法最严厉的国度之一,但却是法律不细的国度,由于《刑法》第253条就这么长,加上《司法解释》也就几页,远远不如GDPR的细致水平。所以我觉得在金融监管里面也要参考数据立法,去监管咱们数据在金融范畴里面的运用,也避免大数据杀熟、大数据狡诈、过度大数据内容引荐,以及大数据来影响选举,这样事情的呈现,还是需求这样的一部法律。

  政府是数据最碎片化的范畴

  咱们最主要的业务是在政府大数据这块,其实要说政府是数据最碎片化的范畴。最近深圳刚出台的《聪慧城市的规划》有这么一句话,叫“市民办事不出街,企业办事不出区”,这个比全国曾经大大进步了一步。大部分中央是这么说的,“市民办事不出区,企业办事不出市”。这个话说的是什么意义,就是给老百姓办事的系统都在街道里、区里,数据也沉淀在这一级。咱们国度有600多个城市、3000左右个区县,有四万街道。李克强总理讲中国80%的数据资源在各级政府机关手里,就在我刚才说的600多个城市、3000多区县和几万个街道。在每个中央还有几十个委办局,几百个单位,是在这些里面的碎片化数据。

  政府应用数据中止金融监管空间庞大

  目前习主席提数字中国,咱们华傲数据也是数字中国国内比较抢先的数据管理者和数据守护者,咱们的幻想是为每一个城市、为每一个区县、每一个街道建一个数据“炼油厂”,建一个数据“加油站”,让这些数据能够更好地运用。当然这个运用是有边境的,受监管的。

  最后我想,希望整个政府对数据的运用也有助于金融监管,特别是应用数据对金融中止监管,政府做金融监管,政府做政府管理,未来也有庞大的空间。

  谢谢大家!

  图片及录音:齐晓彤

  录音整理:邓建乐 刘波

  文字编辑:齐晓彤 邓建乐

文章关键词:

"/> name="description"content="