大數據如何協助打擊14億贗品?

阿里巴巴如何用大數據這把雲劍,掃到假貨商把柄?
阿里巴巴如何用大數據這把雲劍,掃到假貨商把柄?

今年7月25日,中國12個省市公安機關突擊搜查了13家工廠和商店,檢獲1.5萬個內存模塊,涉案金額超過1.2億元人民幣。並逮捕了16個人,涉嫌在阿里巴巴集團旗下C2C購物平台淘寶上假冒金士頓(Kingston)和三星(Samsung)品牌的名義去販賣一批芯片。

這次「雲劍行動」是一個為期4個月的調查行動成果,突顯了現有的「大數據」科技,如何在保護知識產權的執法行動上得到實際應用。當然,這只是芸芸例子中的其中一個。

而被譽為世界最大農藥公司的瑞士先正達(Syngenta)、世界第二大化工公司美國杜邦(DuPont)等國際名牌農藥早前同樣被跨國犯罪集團「垂青」;公安機關今年3月亦在阿里巴巴大數據的協助下,成功將4間涉及將假冒有關品牌的農藥出口到柬埔寨的關聯企業鎖定,警方最後亦成功破獲涉案的生產基地及9條製假生產線。

截至目前為止,2016年全年計,阿里巴巴協助並向執法部門提供的情報和線索,成功搗破了417個製造及銷售假貨的巢穴,拘捕了332名疑犯,起獲價值超過14.3億元人民幣的假冒商品。

問題來了,阿里巴巴靠甚麼技術、數據及搜尋引擎,為這一場又一場的「雲劍行動」背後提供支援?

阿里巴巴平台治理部知識產權保護總監葉智飛表示,阿里巴巴運用數據模型,對涉假商品、售假團隊做溯源追蹤,從而得悉這些販賣假貨團體的線下位置。

機器學習防偽助打假

原來「雲劍」的大數據源於阿里巴巴平台上整套關鍵的打假技術,而支持這套防偽技術更包括一套具備機器學習能力的打假系統,有助系統提取更精準的數據點作分析。而有了足夠數據組成的信息基礎,才能憑着線索及證據,去關閉那些售假的網店,甚至協助執法部門直搗這些犯罪份子的廠房及老巢。

而阿里巴巴這套針對假冒商品監控和識別打假模型可以透過超過100個維度考核淘寶網上所有產品的特徵,由商品本身價格是否處於合理範圍、到網店的樣式、交易記錄、產品發布模式和消費者投訴。該模型會以0至100分對商品及商家進行評級。當數字一般超過80,就會落入警戒級別,極有可能形成刑事犯罪的線索可提供給警方。

部份不法份子亦發現到阿里巴巴可以從系統中比對產品不合理標價的行徑洞悉他們的存在,這些犯罪份子試圖以直接在產品圖片上標以「折扣價」,系統掛上與產品原價無異的方式,意圖混淆系統的視聽。

不過,阿里巴巴亦已提升了其影像識別、商品圖像及商標識別的掃描和分析技術。當發現在網店列表的文本和該店隨之附上的照片並不匹配時,如將一架原價應賣大約10萬元人民幣的名牌手錶在列表介紹的文本上標上此原價,但在該產品配圖上以美工方式添加一個更低的價錢。現在就會被阿里巴巴這套OCR(optical character recognition)識別出來。

而阿里巴巴平台每日新上市的產品,想一想都知道是海量數目,平均每日就有約1,000萬件,這又如何「眾裡尋她」呢?

24小時全天候系統監控打假

阿里巴巴平台上另有一套系統可以每秒分析數以億計的數據點,並全天候24小時通過600個不同的檢測指標監測是否存在可疑帳戶、產品和交易,包括查看賣方行為、產品信息、消費者評論和用戶報告等。

雲劍系統可以將觸發警報的侵權商家挖掘出來,包括賣家身在何方、賣家支付寶帳戶研究及分析、物流地址、與其有關聯的帳戶信息,甚至相對應的國民身份證等溯源出來;當然亦會因應其違反規則的嚴重程度,作相應的合規處理。

全靠阿里巴巴將大數據的科技應用在打假之上,2016雲劍行動總共打擊了包括服裝、鞋類、眼鏡、電器等30多種假貨商品,保護了星巴克、CONVERSE、Adidas、Nike、荷蘭皇家殼牌(Shell)、埃克森美孚(Exxon Mobil)、飛利浦等131個品牌。

當然不法份子最新的犯案方式,只是在平台上留下聯絡或引導消費者走到阿里以外的其他平台進一步溝通銷售假貨,以逃避阿里系統的追擊;正如葉智飛所講,阿里巴巴期望在政府牽頭下,形成執法部門、品牌權利人及平台合力打擊假貨集團的模式。而由過往的案例,線上假貨只是冰山一角,故在權利人舉報、配合互聯網大數據力量及線下執法會形成這個時代一個合適的解決方案。

一起來重溫阿里巴巴如何用大數據來打假:
阿里巴巴如何用大數據來打假

雲計算大數據