極速建模
僅5步鼠標即可極速完成數據建模,大幅縮短模型開發周期。
通過友好的人機交互設計,使得機器學習變得大眾化,降低機器學習的入門門檻,用戶學習成本大大降低。
有別于傳統機器學習平臺,本系統使用新一代的UI設計風格,系統通過豐富的圖表把數據與模型的信息更好地展示出來。
系統對機器學習算法進行大量的底層代碼改進與優化,這不僅讓建模變得更高效,而且使得模型的精度更高。
模型訓練速度以及資源消耗都顯著地優于同類型的產品,最快僅需10來秒就可以得到一個模型,大大提高了模型的迭代速度。
經過大量的數據與客戶反饋驗證,模型訓練效果優于同類型的其他產品。
用戶可以根據專家經驗對樹類型的機器學習模型的訓練進行人工干預,使得機器學習與專家經驗可以有機結合,提高模型的可用性。
用于支持用戶自定義符合平臺規范的分類或回歸算法,自動化算法的各個子模塊編輯完檢驗通過后可以保存至自定義算法庫,后續建模任務中可選擇該庫中的相關算法進行模型訓練、預測等功能。
系統把模型訓練整個流程進行抽象整理,用戶僅需實現幾個關鍵方法即可生成自定義的算法模型。
用戶可以按照自己的需要通過python語言完全按照自己的想法生成自己的算法模型。
自定義算法支持系統的所有功能模塊。
通過機器學習的算法自動生成各種有效切具有業務含義的衍生特征。
通過機器學習算法對變量進行分箱,分箱結果可以手工調整,已達到最佳效果。
根據變量在樹模型中的交互作用,對變量進行兩兩的四則運算,得出交叉衍生變量,這些衍生變量通常具有特定的業務含義,并且可以一定程度解決變量的非線性問題。
根據樹模型從根節點到葉子節點分裂的規則得到的衍生變量,這種衍生變量通常具有很強的業務含義,并且可以一定程度解決變量的非線性問題。
通過單變量歸因的多項式擬合出來的衍生變量,這種變量通常具有很強的相關性。
自動化策略開發
依托自主開發規則抽取機器學習算法,自動根據數據挖掘業務規則,使用決策樹、隨機森林、GBM等算法,探索更多AI規則。
依托自主開發規則抽取機器學習算法,自動根據數據挖掘業務歸因邏輯、業務規則,提升分析人員數據解讀效率。
可使用決策樹、隨機森林、gbm等模型算法,探索更多AI規則。可直接直接對此決策樹進行進一步的調整,剪枝、生長、調整閾值等。
從多維度對人與機器得出的策略進行檢驗分析
用戶可以根據專家經驗錄入自定義的策略,并對策略進行檢驗分析。
專家經驗策略與機器學習搜索出來的策略可以在相同的條件下同時進行數據檢驗,從多維度對比人與機器得出的策略性能。
對多個簡單策略進行組合,根據策略內容對變量進行交叉衍生與規則衍生。
可以對多個簡單策略進行自由組合,成為一個策略組,對策略組進行串行或整體分析,得出策略組合的性能。
根據策略的內容可以對組成策略的變量進行交叉衍生與規則衍生,從而得到一系列具既有業務含義又有很強的預測性能的衍生變量。
支持對歷史版本的追溯和策略的版本回退,對同類下的多個策略進行對比和分析,并對策略進行持續性監控,分析其性能表現。
支持對歷史版本的追溯和策略的版本回退。可通過版本設置,對策略進行版本回退以及切換后查看歷史版本信息。
支持對同類下的多個策略進行對比,從重要變量、指標、分箱等多維度進行對比分析。
對上線的策略進行持續的監控,分析策略在新的數據上的性能表現。
專家建模
專家建模模塊實現了集約化的統一管理開發環境,并提供極速建模SDK,依賴包管理。
可以通過SDK調用系統的基本功能,包括模型訓練、預測、檢驗、發布服務等。
可以通過SDK調用系統支持的所有數據源的操作,使得數據探索更加簡便、快捷。
外部平臺訓練得到的模型可以使用相關的接口導入到本系統使用。
通過定制化的jupyter lab或notebook,用戶可以通過python、R或其他高級語言進行機器學習的探索。
通過jupyter lab和notebook環境,建模人員可以通過自由編寫代碼的方式訓練出更加專業的機器學習模型。
用戶可以通過上傳第三方放依賴包的方式創建特定的虛擬環境,以滿足不同的建模場景。
系統提供SAS編程環境以支持SAS的模型開發。
模型自學習
領先市場的自動化能力,AutoML、AutoFeature提升模型精度。
對在開始學習過程之前設置值的參數進行優化,給學習機選擇一組最優超參數,以提高學習的性能和效果。
使用多種特征篩選方式,自動搜索出最優的特征組合。
通過對樹模型節點分裂的規則加以專家經驗的限制,使得訓練出來的模型具有更好的泛化性。
無需專業建模知識,僅需簡單的配置,即可在多種機器學習算法中探索出最優的算法與超參組合。
建模專家可以把特定的建模迭代優化策略固化,普通用戶可以使用建模專家的優化策略訓練自己的模型。
系統支持定時調度功能,支持自動化模型迭代、自動化模型預測與自動化模型檢驗等功能。
通過配置指定的建模頻率、建模參數、以及建模數據,系統可以定時地對模型進行迭代升級。
通過配置指定的預測頻率和預測數據,系統可以使用指定的模型對新數據進行自動預測分析。
通過配置指定的檢驗頻率和檢驗數據,系統可以對指定的模型進行性能檢驗,不斷地監控模型的性能表現。
讓機器學習變得更簡單、高效、精準
對于各種業務場景進行機器學習分析建模,特別是金融風控場景、營銷場景。
使用各種機器學習算法進行模型訓練與預測評分。
使用傳統的邏輯評分卡模型進行模型訓練與預測評分。
從海量數據中挖掘有效業務策略規則,進行策略規則的驗證與分析。
使用機器學習算法對原始數據進行特征加工與衍生,從而使得訓練的模型具有更高的性能。
一鍵式地把模型發布成SDK開發包、實時推理服務或批量推理服務。
持續地對模型使用新數據進行自迭代,不斷的優化或監控模型性能。
