A.高維性
B.規(guī)模
C.稀疏性
D.噪聲和離群點
您可能感興趣的試卷
你可能感興趣的試題
A.精度
B.Rand統(tǒng)計量
C.Jaccard系數(shù)
D.召回率
A.輪廓系數(shù)
B.共性分類相關(guān)系數(shù)
C.熵
D.F度量
A.規(guī)則集的表達能力遠(yuǎn)不如決策樹好
B.基于規(guī)則的分類器都對屬性空間進行直線劃分,并將類指派到每個劃分
C.無法被用來產(chǎn)生更易于解釋的描述性模型
D.非常適合處理類分布不平衡的數(shù)據(jù)集
A.構(gòu)造網(wǎng)絡(luò)費時費力
B.對模型的過分問題非常魯棒
C.貝葉斯網(wǎng)絡(luò)不適合處理不完整的數(shù)據(jù)
D.網(wǎng)絡(luò)結(jié)構(gòu)確定后,添加變量相當(dāng)麻煩
A.F1度量
B.召回率(recall)
C.精度(precision)
D.真正率(ture positive rate,TPR)
最新試題
數(shù)據(jù)索引是保證數(shù)據(jù)處理高性能的軟件角度的一種手段,不做數(shù)據(jù)索引的數(shù)據(jù)訪問是線性訪問,但是做了索引的數(shù)據(jù)訪問會成倍的降低訪問時間。
公司內(nèi)部收集的數(shù)據(jù)不存在需要考慮數(shù)據(jù)隱私的環(huán)節(jié)。
要將工作申請分為兩類,并使用密度估計來檢測離職申請人,我們可以使用生成分類器。
數(shù)據(jù)收集中的拉模式需要通過定時的方式不斷地觸發(fā),才能源源不斷地獲取對應(yīng)的數(shù)據(jù)。
由于決策樹學(xué)會了對離散值輸出而不是實值函數(shù)進行分類,因此它們不可能過度擬合。
無論質(zhì)心的初始化如何,K-Means始終會給出相同的結(jié)果。
通過統(tǒng)計學(xué)可以推測擲兩個撒子同時選中3點的幾率。
任何對數(shù)據(jù)處理與存儲系統(tǒng)的操作均需要記錄,這符合數(shù)據(jù)安全的要求。
當(dāng)數(shù)據(jù)集標(biāo)簽錯誤的數(shù)據(jù)點時,隨機森林通常比AdaBoost更好。
假設(shè)屬性的數(shù)量固定,則可以在時間上以線性方式學(xué)習(xí)基于高斯的貝葉斯最優(yōu)分類器,而該數(shù)量是數(shù)據(jù)集中記錄的數(shù)量。