用戶行為分析與畫像平臺

  1. 產(chǎn)品簡介

基于Hadoop/Spark大數(shù)據(jù)處理平臺,利用靜態(tài)表的字典和程序自學(xué)習的庫數(shù)據(jù),對電信運營商的用戶上網(wǎng)數(shù)據(jù)進行采集、解析、關(guān)聯(lián)、挖掘,獲取手機用戶的行為和位置信息,并在此基礎(chǔ)上結(jié)合業(yè)務(wù)目標,通過構(gòu)建相關(guān)領(lǐng)域的知識圖譜,形成用戶的行為標簽、位置標簽、偏好標簽、關(guān)聯(lián)標簽等用戶畫像體系。

  1. 系統(tǒng)架構(gòu)
  2. 功能概述
    • 用戶行為分析建模
    • 用戶畫像體系
  3. 技術(shù)特色及優(yōu)勢
    • DPI精準識別引擎,可識別業(yè)務(wù)種類超5000種,90%以上移動互聯(lián)網(wǎng)應(yīng)用
    • 分布式ETL預(yù)處理技術(shù),每天處理20TB以上級數(shù)據(jù),且時延為秒級;
    • 大數(shù)據(jù)查詢及全文檢索應(yīng)用的任務(wù)管理機制,支持查詢的任務(wù)式管理;
    • 基于用戶行為數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)相結(jié)合的多維度的數(shù)據(jù)挖掘分析模型;
    • 精準位置識別定位算法,精度可達100m(80%置信度)
    • 有力的后臺數(shù)據(jù)支撐:APP特征庫、APP動作庫、終端庫、手機號段歸屬地、服務(wù)IP歸屬地、賬號規(guī)則識別、搜索關(guān)鍵字特征庫。1套可擴展的標簽字典:基礎(chǔ)60類,4級體系,10萬個標簽字典,可擴展。