194
金數據
如何防止刷票或減少無效數據的收集
對於投票、調查類的表單,往往會遇到隨意填寫或用機器填寫的數據(刷票),這些數據浪費存儲空間,嚴重的可能會造成整個分析結果失效。以下是金數據根據這類表單的特點,總結的一些製表設置時的建議,希望能幫助用戶獲得合格高質量的數據。
設置填寫權限
從技術上講,任何投票都無法完全避免刷票。但通過一定的限製,能夠提升刷票成本,降低刷票幾率,從而降低垃圾數據的產生。在您表單的 設置 —— 數據收集 的上部,可以設置填寫者權限。通過有針對性的設置,您可以有效地減少刷票概率。
圖中的設置有如下效果:
不做限製 打開表單的任何人都能夠任意次數地提交數據。
每個金數據用戶限填一次 開啟這個選項時,用戶需要登錄金數據才能填寫表單。如果潛在填表者沒有金數據賬戶,則他需要創建一個賬戶才能填寫。 此限製可能會因為注冊流程而讓潛在填表者望而卻步,但能夠極大地增加刷票成本,提升數據質量。
每台電腦/手機限填一次 該限製依賴於用戶瀏覽器地 Cookies,如果用戶禁用 Cookies 或每次提交後清除 Cookies 或者更換多個瀏覽器多個填寫設備填寫,則該限製將失效。 該限製屬於比較弱的限製,對於機器刷票或清除 Cookies 刷票毫無幫助。 表單在微信中填寫,用戶退出微信會自動清除 Cookies,這會導致該限製失效。
每個IP限填一次 這是最嚴格的限製,極容易誤傷。但是該限製對機器刷票有較好的抑製效果。 但是,學校、公司等公共場所的對外出口隻有一個或者幾個 IP 地址,來自這些區域的填表者會無法正常提交;來自省內同一個運營商的手機用戶也可能是通過有限的 IP 地址池訪問互聯網,這些用戶也有可能無法正常提交。
加密:憑密碼填寫 這個主要用於信任的人的填寫。除了知道密碼,其他人不可能成功填寫表單。
私密:僅我和表單管理員、數據維護員可填 這個配置主要用來進行內部數據填報,使用這個配置的表單基本上無法被外部填寫。
以上配置中,使用 每台電腦/手機限填一次 是最弱的防範機製;使用 ** IP/金數據賬戶** 是相對較強的方式。沒有十全十美的解決辦法,需要自己在活動過程中慢慢調整。 另外,加上驗證碼是必須的選擇。加上驗證碼能夠極大的提高刷票的難度,同時對用戶的體驗影響也較小。
使用手機字段
在您的表單中添加手機字段,通過合理的設置,也可以很好的減少刷票行為。
使用短信驗證 使用該功能後,表單提交時必須輸入手機驗證碼才能提交,雖然這會消耗您的短信餘量,但是極大地增加數據有效性及減少刷票行為。
限定手機號 + 不能和已有數據重複 對於一些特定場合,通過這兩個設置的組合,您可以實現麵向部分人的一次性填寫,這樣一方麵限定了人群,一方麵也限定了填寫次數,是個比較強的限製組合。
限製數據收集的時間、數量
通過定時、限製數據量的數據收集設置[點我查看],您可以減少表單暴露的時間,以減少被外部分析的幾率。
將表單變得複雜
如果您對數據質量的要求非常高,您還可以參考以下原則來設計表單:
不設置默認選項,以增加用戶的選擇/輸入成本。 例如對於單選、多選類,不設置默認選項,用戶會花時間思考再做出選擇。
提供至少一個以上的、需要用戶輸入的字段。 該字段可以是姓名、電話號碼等,並且設置其中至少一項為必選、不能重複。
對於某些關鍵問題,可以采用同一個目的、多個問題反複問的方式,獲得真實數據。 您在後期篩選的時候可以通過組合篩選,過濾掉這些無效數據。例如,在一個調查問卷中,詢問現在的幸福感,你可以給出兩個問題:
- 你覺得現在的工作滿意嗎? 不滿意/還行/非常滿意
- 你對下一份工作充滿期待嗎? 好不期待/一般/非常期待
如果用戶填寫了「非常滿意」,又填寫了「非常期待」,這條數據的價值就不大了。
最後更新:2017-01-14 10:04:34