admin 發表於 2022-7-2 15:55:38

大数据倒在2019:十余家公司被調查,最严监管時代到来

一場大数据行業出生以来最大范围的“地動”正在產生。

2019年9月6日,第三方数据風控公司魔蝎数据和新颜科技的相干賣力人在统一天被警方带走查询拜访,由此拉開了行業大整理的序幕,聚信立、天翼征信、公信寶、同盾科技子公司、51信誉卡、考拉征信等诸多公司也被纳入查询拜访行列。

業内助士广泛認為,這次整理與数据公司的爬虫营業和数据的违规操纵有關。究其本色,是對現金貸营業的整理。

需求催生了市場。自2013年互联網金融觀點鼓起以来,催生了一批為網貸平台、消费金融公司、現金貸公司供给征信風控辦事的数据公司,他們操纵爬虫技能的成熟與海内数据信息羁系的宽松,經由過程自稀有据、爬虫抓取、金融機構二次授权、地下黑產買賣等方法,蛮横發展。

陪伴着國度對暴力催收、現金貸营業的羁系力度加大,一批曾風景的数据風控公司密集被查询拜访,爬虫营業暂停,“灰產”行業人人自危。

就在12月4日,國度收集平安传递中間發文传递下架整改100款违法违规APP,此中不乏知名的樊登念书、糖豆、更美、房天劣等,整改重點针對無隐私协定、采集利用小我信息范畴描写不清、超范畴收集小我信息和非需要收集小我信息等情景。

曾,一度有概念認為,大数据期間到临,得大数据者得全國,電商、营销等平台把大数据作為本身焦點的竞争力,却不知,技能無罪,但技能也會成為作歹者的东西。

史上最严羁系已到临,正如業内助士所说:“大数据成长和操纵從蛮横發展期間進入了正规化辦理的關头期間。”

数据行業大地動

本年起头,互联網金融行業進入大整理,作為現金貸風控的關头一环,供给数据支持的第三方公司成為三季度以来的羁系重點。

2019年9月6日,魔蝎数据被警方查询拜访,高管被带走;同日,新颜科技高管被带走协助查询拜访。9月11日,公信寶運营方杭州存信数据科技有限公司被警方查封;中秋節時代,同盾科技子公司信川科技也有相干职員被警方带走协助查询拜访;10月21日,51信誉卡拜托外包催收公司因涉嫌挑衅滋事等犯法被查询拜访,该公司操纵爬虫技能不合法盗取用户数据、滥用用户信息举行暴力催收。

這一系列整治的暗地里,矛头指向的是網貸。11月14日,公安部收集平安捍卫局局长王瑛玮暗示,本年5月25日以来,對“套路貸”施行團伙、催收團伙和帮忙“套路貸”犯法的技能辦事商、数据支持辦事商、付出辦事商展開了全链条式冲击。

11月20日再传出動静,江苏淮安警方冲击了7家涉嫌加害公民小我信息犯法的公司,涉嫌不法缓存公民小我信息1亿多条,此中,拉卡拉付出旗下的考拉征信涉嫌從上遊公司获得接口後,违规将盘問接口出賣。

圖 / Pexels

這些被查询拜访的公司,可能面對的配合問题是操纵收集爬虫技能抓取数据并销售,涉嫌加害公民小我信息。

收集爬虫是指依照必定法则,主動抓取互联網信息微晶瓷,的步伐。這项技能并没有原罪,業内很多公司會經由過程爬虫技能,将用户在互联網上的数据采集起来,做出更精准的用户風控模子。某数据钻研院院长刘志奉告燃財經,搜刮引擎、天眼查、企查查等公司都是用爬虫技能爬取公然数据,在不触及小我敏感数据的环境下,利用這项技能没有問题。

但對付這些大数据公司来讲,他們把爬虫做成為了產物,而且“走了两步”。第一步是在面向用户的產物中,讓小我用户填写账号暗码,從公积金、社保局、信誉卡中間等體系中帮用户把内里的信息拿出来,第二步是把這些包括不少小我敏感数据的信息缓存在體系,以後對外提供应印子錢、催收公司等利用。“到第一步没有問题,但到第二步就涉嫌過分收集、违规利用数据,加害用户隐私。”刘志说。

這些数占有多大杀伤力?新金融深度曾報导,大数据辦事公司聚信立只要获得用户的手機号码和辦事码,便可登录各大運营商的體系爬取通話记實的数据,構成“小我用户陈述”,包含通話号码、次数、時长等,告貸人的通信信息就會成為假貸機構向告貸人及其家人朋侪催收的“利器”。這時候,這种公司至關于协助了貸款平台的暴力催收。

刘志诠释,做風控必要多维度的数据,若是全数經由過程正规渠道去拿,一方脸孔前行業内没有太多渠道,另外一方面数据本錢很高,但經由過程爬虫去获得,边际本錢很低。此外,数据公司經由過程爬虫拿到的数据颗粒度更细,除做風控還可以提供应一些公司做营销,获益更大。是以,業内呈現一多量违规操作的数据公司。

数据從何而来?

多名業内助士先容,数据公司的数据来历凡是分為四大类:企業本身或其相干公司的数据、爬虫技能爬取数据、相干現金貸公司在用户协定长進行二次授权、經由過程地下買賣不法采辦相干信息。

金融行業投影繪畫機,從業者张丰先容,對付第一种环境,公信寶推脱手機挖矿產物,用户免费利用的同時,必要供给大量小我信息,公司便可借此采集数据;考拉征信属于拉卡拉付出参股公司,其数据来历可能包含在拉卡拉长進行信誉卡還款、缴费、金融营業的小我用户数据,和線下商户谋劃的数据。

此外,一些合规的企業很多也具有“数据基因”,如前海征信是安全團體旗下全資子公司,其官網显示:前海征信植根于安全團體,摸索多样化和立异性的数据收集、存储、处置與阐發方法,有着本身独占的上風。

第二种环境是数据公司用爬虫技能去公然網站等处所爬取数据,重要分為司法信息、電商信息、銀行卡信息、運营商信息、社交信息、開放数据等几大类。

云鼎實行室2018年公布的《互联網歹意爬虫阐發》陈述显示,排名前三位的流量方针行業来自出行、電商、社交,運营商和大眾行政别离占比4.91%,被爬的频率也较為靠前。

此中,大眾行政类歹意爬虫重要集中在法院文书、常识產权、企業信息、信誉信息等通例贸易信息范畴,而另外一个受爬虫青睐的是登记类平台。

用户授权也是一种經常使用的信息获得手腕,如一些現金貸公司在隐私条目用户协定里写了容许其對用户信息二次授权,而下载软件的時辰可能读取了用户的通信录、定位、相册等信息。

此前,中國信通院公布的《挪動金融利用平安白皮书(2019年)》中,抽样拔取了12款下载量過亿的典范金融行業APP,所有APP均存在分歧水平的超范畴权限收集征象。這些APP共获得了29种高敏感权限、15种中敏感权限、33种低敏感权限。高敏感权限包含读取手機状况和身份、點窜或删除存储卡中的内容、读取體系日记等等。

在隐私政策方面,抽样的部門APP也涉嫌违法违规。比方,某款金融行業APP隐私政策中呈現请求用户供给指纹、脸部辨認信息等小我敏感信息,現實长進行登录等操作時其實不必要。

来历 / 信通院陈述

曾有報导称,摩羯科技的付出寶爬虫產物只必要用付出寶扫描一下登录“二维码”(第三方天生),後台便可爬取用户的真實姓名、手機号、收貨地點、近一年的購物信息,乃至具體到每笔買賣的金额。而颠末授权的微信爬虫则可以获得用户接洽人、存眷的公家号、本身是群主的群、微信買賣记實、绑定的手機号码等信息。

今朝,公安構造已展開APP违法收集小我信息集中整治。就在12月4日,樊登念书、糖豆、更美、房全國、康健天津、考拉海購等在内的100款APP涉嫌违法违规被國度收集平安中間告示下架整改。

這次整治,重點针對無隐私协定、采集利用小我信息范畴描写不清、超范畴收集小我信息和非需要收集小我信息等情景。

本年以来,公安部分已查处违规收集小我信息的APP共683款,峻厉冲击小我信息黑灰產乱像。

此外還存在的是行業内很广泛的数据互通和地下買賣。

张丰先容,一些小公司會把本身的数据上传到一个第三方利用库,和同業一對一互查,但最後极可能数据都保存到了第三方被再次買賣。網上另有很多QQ群、暗網上出售数据,有的企業内部員工稀有据库权限,擅自保存買賣用户数据,用违规插件获得数据等,使得這个市場加倍紊乱。

這些获得数据的方法是不是违规?

持久存眷金融行業的状師肖飒暗示,經由過程地下買賣不法收購相干信息必定违规,情節紧张會有刑事犯法危害,触及到刑律例定的加害公民小我信息罪。按照劃定,违规向别人出售或供给公民小我信息,情節出格紧张的,可处三年以上七年如下有期徒刑,并惩罚金。

至于用爬虫抓守信息是不是违规,要看详细情景,若是經由過程爬虫抓取收集公然信息,其實不违法,但触及到公司或小我信息時,關头點在于是不是获得小我或公司的授权。缺乏授权,就會涉嫌违规,會组成加害公民小我信息罪。

蛮横發展後的行業深渊

第三方数据財產几近是陪伴着海内網貸行業盈利而生的一波企業。

按照亿欧智库公布的《2018中國智能風控钻研陈述》,截至客岁年末,573家金融風控企業共得到投資金额跨越1000亿元,此中三成企業得到三次及以上的投資。

這些企業中,69.8%建立于2013年-2017年,2014年增加率到达156%。2015年,新增企業数量到达峰值——148家,跟着2016年起头渐渐落實的严酷羁系政策,智能風控乃至金融科技的新增企業数目起头回落。截止到2018年上半年,唯一5家智能風控新增企業。

這一批風潮中,出生了魔蝎科技、聚信立、51信誉卡等一系列明星公司,它們的营業大同小异。

此中,魔蝎科技建立于2016年,面向企業用户,供给多维度用户画像、授信评分、貸後预警、催收智能運筹等危害辦理辦事;面向小我用户,供给運营商、網銀、信誉卡、借记卡、公积金、社保、付出寶、淘寶、京东和學信網等一站式盘問。

聚信立建立于2013年,為銀行、保險、消费金额公司、貸款機構等供给智能風控、危害阐發、信誉阐發等解决方案。值得注重的是,京东数科是其第二大股东。

業内助士先容,在現金貸营業最為火热的時辰,一些小范围的放貸公司大多没有能力或不肯意花费精神去自建風控模子,會直接采購第三方数据公司的風控體系,代價在2万元-8万元不等。這些第三方公司钻了爬虫技能成熟但法令羁系不太完美的空子,蛮横發展,猖獗赢利。

恰是由于他們低落了線上放貸的門坎,多量质量良莠不齐的放貸機構参加,助长了“套路貸”、“印子錢”、暴力催收,也發生诸多行業乱象。

此前,2018年,“大数据行業第一股”数据堂員工销售公民信息案曾激發業内震動,公司在8个月内,日均传输公民小我信息1.3亿余条,從泉源到中转商再到下流利用者,共11家公司牵扯此中。2019年3月,燃財經曾独家起底巧达科技,该公司拿8亿人的数据一年赚取近2亿元利润。本年5月,北京市公安局網安总队传递,该公司36人已被查察構造批捕。

数据公司助长了現金貸的暴發,恶性竞争也将這一行業推向深渊。

刘志先容,缓存用户数据和用爬虫爬守信息的本錢很低,比拟之下,一些合规的数据公司拿数据本錢很高,他們就没法子跟這些公司去打代價战,保存艰巨。

“以前的那些数据公司,没有明文劃定或峻厉冲击的案例参考,一向在法令边沿遊走。如今羁系起头發力,這些劣幣渐渐被断根出去,良幣會迎来春季。”刘志暗示。

大数据步入羁系期間

從放貸、助貸到催收,羁系風暴已密集来袭。

10月21日,最高人民法院、最高人民查察院、公安部、司法部结合公布《關于打點不法放貸刑事案件若干問题的定见》,请求放貸現實年利率不得跨越36%。

央行還向部門銀行下發了《小我金融信息(数据)庇护试行法子》。文件暗示,将對金融機構與第三方之間征信营業勾當等進一步作出明白劃定,加大對违规收集、利用小我征信信息的惩辦力度。

严管之下,金融大数据公司草木皆兵。范围较大的金融機構可以自建風控體系,但第三方公司营業進入障碍期。

多名業内助士奉告燃財經,9月起头,葫芦数据、白骑士、立木征信等数据風控商都暂停了爬虫辦事,聚信立和新颜科技也颁布發表暂停相干辦事,摩蝎科技官網已没法打開。同盾科技奉告燃財經,其子公司信川科技自2018起头就已逐步伐整紧缩,今朝已全数遏制响应辦事。

刘志暗示,摩蝎、新颜這种公司重要的產物就是爬虫辦事,出了問题根基上全部公司的营業就停了,同盾科技很早就把爬虫團队给區分出去,不影响其他营業,公信寶也是同样。可是從互助层面来看,會對他們在数据平安、合规互助的方面發生必定影响,一些互助商此後會再也不互助。

這一轮對第三方数据風控公司的整理,其本源還是為了金融危害专项整治更深刻化,整肃到数据泉源,冲击大数据公司,間接整理了現金貸和助貸行業。

濕氣去除方法,
圖 / 視觉中國

“大数据成长和操纵從蛮横發展期間進入了正规化辦理的關头期間。蛮横發展期間看似讓大数据行業获得快速成长,但真正讓用户受益的项目很少,反而加害到了平凡人的隐私。正规化辦理固然必定水平上影响了大数据行業的成长,使其受限于必定的框架下,但從久远来看,如许的正规化辦理才是有用的,法治下的大数据成长才是正路。”肖飒说。

在她眼里,行業乱象與企業本身和羁系不力都有瓜葛。企業為了长处挺而走險,明知陵犯别人权柄,依然施行举動。羁系也有必定的责任,前置的行政律例缺失,致使企業举動一步步恶化。此外,為了处所效益,羁系部分存在着睁一只眼闭一只眼的征象。将来企業要做到合规,羁系部分要加速相干律例的配套,加大法律力度。

“蛮横發展的期間已竣事了,行業必要在法令律例的指导下举行,固然行業的规范也不克不及過犹不及,要合适中國國情。”肖飒说。

张丰認為,全部大数据行業在逐步往合规方面走。合规的表示,就是會有天資请求,相干的羁系政策、文件、惩罚文件城市出台,就像有消费金融派司才能做消费金融营業內科辦公室,,大数据買賣必要大数据買賣的派司。施行進程中仍是要遭到國度的峻厉监控,不論是数据渠道,仍是商用处景城市严酷监控,持牌的数据公司也必要做好数据平安防备。

2019年,大数据再也不是“放之四海皆准”的“灵丹灵藥”。大数据造福行業的同時,羁系會成為時刻悬在其头顶上的达摩克利斯之剑。

*题圖来历于視觉中國。应受访者请求,文中刘志、张丰為假名。
頁: [1]
查看完整版本: 大数据倒在2019:十余家公司被調查,最严监管時代到来