420
汽車大全
一加五手機跑分造假
一加 5 再被爆跑分造假,XDA 有分析有真相
原創|2017-06-22
“除了外形被認為“借鑒”iPhone 7P之外,一加又一次被安卓開發者論壇XDA“掛了”。而這一次,依然是跑分作弊。
導語:除了外形被認為“借鑒”iPhone 7P之外,一加又一次被安卓開發者論壇XDA“掛了”。而這一次,依然是跑分作弊。
本文作者:周翔
雷鋒網按:本文由雷鋒網外翻作者Tinpo翻譯,周翔編輯。
6月21日淩晨,在京東預約量已超過60萬台的一加5正式在海外發布,驍龍835,5.5寸1080P AMOLED顯示屏,6+64G或8+128G存儲組合,1600萬+2000萬雙攝,美版479美元的起售價,國行版2999元的起售價。
除了售價比小米6高之外,相比三星、HTC等品牌,一加5依然具備不錯的性價比。然而,一直以來在國外頗有口碑的一加這次卻遭遇諸多爭議。除了外形被認為“借鑒”iPhone 7P之外,一加又一次被安卓開發者論壇XDA“掛了”。而這一次,依然是跑分作弊。
今年早些時候,XDA曾發布了一份報告,譴責一加有著針對特定跑分應用臨時拔高處理器頻率的“惡習”,在一加為大陸用戶準備的氫OS中,這已經是一項標配的係統特性,而在為海外用戶而設的氧OS 裏,跑分作弊的情況目前還隻是在社群測試的版本中出現。而這種行為在當時同樣采用驍龍821的手機小米Note 2和穀歌Pixel上並未得到重現。
一加當時火速回應稱,未來不會在手機係統中再加入這樣的“功能”,而這麼做的初衷也隻是為了讓使用者在某些特定應用(尤其是遊戲)中獲得“更加出色的體驗”。
如今,一加5再次被抓包,XDA表示,“騙我一次,算我傻;騙我兩次,算你狠。”
那麼XDA到底有哪些證據呢?雷鋒網編譯了XDA的文章,讀者可以自行判斷。
早些時候,我們就發布過一個報告,譴責了一加(以及一些其他公司)對氧OS係統跑分這一塊動手腳的行為。今天,我們又要很遺憾地表示,一加5手機的跑分數據,又摻水分了。
在一加5正式發布的十天前,我們就收到了來自一加的樣機。在測評時,我們發現這款產品在跑分環節造假的問題。這簡直不可原諒,因為這不僅僅是在誤導消費者,更是對手機測評和媒體工作者的愚弄和褻瀆。如果一個產品的好評基於一份被操縱的評分,又有什麼意義呢?更糟糕的是,起碼上次他們隻是調整了波動和溫控,並沒有過分地拔高評分;而這次的跑分作弊就有點明目張膽,甚至無所不用其極了。
在介紹具體的細節之前,我想要嚴肅表達對一加公司一再采用這種低劣手段的失望之情。因為那些欺詐手段影響了我們的所有測試,我們暫時也不打算給出一份產品表現的全麵分析。我們也會把這份報告和最後對產品本身的綜合評判區別開來,我們相信,通過此份報告以及與一加公司方麵的溝通,那些造假的代碼不會出現在消費者收到的量產機上。當然,我們不確定這篇文章會不會影響您對機器本身的看法,我們隻是提醒您關於這家公司再次的越界行為。
一加是如何操縱跑分的?
一月,在氧OS的測試版本和零售版一加3T的軟件中,我們就“挖”出了一個造假機製。當時我們認為這是氧OS和氫OS的開發團隊合並造成的,雖然有待證實,我們猜測氧OS應該已經與氫OS共享底層代碼庫了。而一些來自一加方麵的評論則在一定程度上證實了我們的猜想。至於一加5,我們發現了一個不同的造假機製。
下麵談談它是如何運作的?它的造假方式明顯又蓄意,一如我們在早期的安卓旗艦機看到過的那樣——以極具誤導性的方式,最大化跑分得分。當用戶啟動一個跑分應用時,調節開關卻像不存在一樣(至少我們看不到這種情況),小集群的最小頻率總會跳到性能監控所見的最大頻率。所有的小核心都會“被”保持在1.9GHZ。通過這樣的造假, 一加5得到了至今為止驍龍835機器在GeekBench 4上一些最高的跑分成績,考慮到它的配置以及這樣的設置,這很有可能是可達到的最高得分。這個得分可比類似的設備和高通自己的MSM8998測試設備的得分要高得多。以下是一些受影響的跑分軟件:
AnTuTu (com.antutu.benchmark.full)Androbench (com.andromeda.androbench2)Geekbench 4 (com.primatelabs.geekbench)GFXBench (com.glbenchmark.glbenchmark27)Quadrant (com.aurorasoftworks.quadrant.ui.standard)Nenamark 2 (se.nena.nenamark2)Vellamo (com.quicinc.vellamo)
毫無意外,受到影響的應用和上次的應用是相同的,顯然一加公司針對的是相同的程序包。分數差異也完全在預期之內。不過我們也有手段通過GeekBench 4來“調戲”這個造假係統。類似於我們在上次報告中提到的,我們發現,當我們運行從Play Store下載的GeekBench 4的時候,該設備多核運行的得分突破了6700,而一旦我們運行隱藏式的GeekBench版本的話,得分就如所料的那樣,從未超過6500。在下圖中你可以看到運行從應用商店下載GeekBench 4時,一加5的小核心的頻率隨時間的變化,以及對比同配置下運行去除了標識符碼的GeekBench 4版本的結果。
每隔100毫秒,我們會讀取一次的CPU頻率。總的來說,如果不造假,實際上,隻有24.4%的讀數反饋的最大頻率為1.9GHZ。與此同時,在不繞開造假係統的情況下,這個比率高達95%。這就很明顯了,一加讓CPU頻率在跑分時的頻率虛高,不僅拔高了多核測試下的跑分得分,也使得在其他CPU相關的分解測試中得到的數據不再可靠(特別對於整數和浮點運算)。這個差異在多核心測分時最為明顯,當然,也最有利。但是,單核心測分的結果則出乎意料的相似,實際上,如果不在跑分過程中作弊的話,得分反而比均值要高。
盡管如此,大多數人在討論設備跑分的時候,多核得分依然是最被考慮和關注的數字。畢竟安卓是一個高度並行的操作係統,在多年來支持多核之後,現在安卓上已經滿是支持多線程的應用,即使說隻有多線程下的跑分的增分才有實際意義,這也不是跑分造假的借口,因為這對於其他沒有作弊的設備不公平。這些被操縱的跑分結果並不代表一加5的現實世界中的表現,它們僅僅反映了在沒有約束的人為條件設備所能達到的一個峰值,或者說,一個實際上達不到的表現。
在運行GeekBench 4的時候,繞過與不繞過造假係統,多核心測分的差距可以高達6.5%,盡管平均水平為5%左右。它可能看起來有點微不足道,但這種差距足以推動一加5“看起來”領先於其他搭載驍龍835的設備。在上麵你可以看到一個點圖,多個獨立運行的GeekBench 4,有沒有繞過造假係統,差別很明顯。簡單來說,人為提高CPU頻率無疑能在跑分時拿到更好的結果。下麵你還可以看到一個隨著時間推移,設備表現和溫度變化的圖表,我們試圖確定是否會有放鬆溫控的情況,或者在持續的跑分過程中分數是否會出現差異。
我們設置了一個GeekBench 4對比組,在結果反饋在屏幕上和開啟下一次跑分中間設置了兩秒間隔,然後用FLIR熱感攝像機來測量外部設備溫度(不是根據安卓的電池溫度),在兩秒間隔內快速進行三次測量取均值。總的來說,我挺驚訝的,這兩種設備以相同的速度升溫,並都沒有測分的下降,每項結果都在預期的波動內,說明運行中並沒有溫度控製。經過進一步觀察,這倒算不上驚訝,因為持續性是Cortex-A73的固有優勢之一,而驍龍835的Kryo核心正是基於此的。當然,我們在John Poole的采訪中也了解到,受影響的核心常常是高效能的核心,GeekBench 4有特別采取措施來防止熱調節對各項測分的影響。
有趣的是,並不是所有的流行的測評應用都被一加的作弊機製所鎖定。例如,在運行3DMark的時候,並沒有看到這些問題。但是,其他的像GFXBench這樣測評軟件還是被“盯著”的,我們在打開和運行它的時候看到了相同的CPU行為。事實上,在持續運行GFXBench的Manhattan電池性能測試的時候,一加5的外部溫度超過了50攝氏度,這在我以往測評過的設備中相當罕見,一般都會采取一定程度的溫度控製來防止過熱。
騙我一次,算我傻;騙我兩次,算你狠
這就有點讓人尷尬了,因為我們不得不因為廠商操縱測評的原因掛同一家公司兩次。所有一切都發生在工程機的測評環節,這嚴格來說更糟了,因為這種造假旨在過度表現自家設備的性能,讓它顯得更好或者更快。這些準備好的把戲被在投入銷售前送到媒體麵前,他們要根據從一加公司拿到的設備說結論,而許多媒體又不太願意在測評環節指出這種造假。我們XDA一直密切注意著操縱測評的行為,因為以前就發現過一次,我們隻是覺得最好把它告訴我們的讀者和潛在的手機購買者。
我們希望這篇文章能夠重新點燃關於測評軟件、它們的角色以及它們在當今智能手機評論中的效用的更為廣泛的討論。毫無疑問,像高通和三星這樣的公司確實關心跑分,即使在開發處理器時他們有更複雜的工具來判斷他們設備的性能,他們依然認為跑分軟件不特別完整但是有效的方式。總的說,隻要一個人能夠理解測評的數據反映了什麼結果,跑分軟件就相當有意義。我認為當下我們應該把關注放在在實際表現和功效的問題上,而不是原始的計算或處理能力上。當然,關於實際表現的瓶頸終究來源於安卓和實現它的OEM廠商。
話題回到一加手機,我真的不知道為什麼公司的軟件團隊,在已經被叫停過之後重新引入了操縱跑分的機製。這次更糟,它明顯地是為了蓄意拔高分數。一加5本身是個非常優秀的設備,真的不需要用跑分作弊來做聲明。認真地說,一加5的流暢性和反應速度一直讓我很驚訝,在花了很多時間測試他們的設備,和他們管理層打交道之後,我清楚地知道他們的手機是多麼的強大。但是,操縱跑分成績是一個蓄意的行為,很有可能的是,他們寧願去惹怒一個小部分人,也要在互聯網上為它們的設備粉飾出一個虛高的評分。無論如何,我真誠地希望一加公司能改正,我對他們的硬件有很多話想說,可他們在我眼中已然走上了歧路。
來自一加的回應
我們之前聯係過一加公司希望他們對這篇文章表達看法,他們是這樣回應的:
人們使用跑分應用來確定他們設備的性能,而我們則希望用戶能看一加5的真實性能。所以我們讓跑分應用在接近日常使用的狀態下運行,比如資源密集型的應用和遊戲。此外,當啟動應用時,一加5會運行在一個類似的狀態下,以增加應用的打開速度。我們沒有過度鎖定設備,而是在充分展示一加5的性能潛力。
這份早上剛接到的聲明讓我頗為震驚。跑分造假機製讓設備進入的狀態顯然不是什麼“日常使用的狀態”,這種驚人的表現可不會在其他沒有刻意提高性能的應用運行時出現。
請記住,與競爭意義下的過度鎖定不同,大多數手機跑分應用隻是用來顯示手機在日常使用中表現得如何。它不隻是盡可能要去嚐試達到一個最高的分數,而是手機在常規發熱和電池用量的情況下如何表現的一個試驗,這是代表手機如何日常運行的試驗。這些跑分測試並不是為了測量在現實世界中無法實現的某些“性能潛力”。
在GeekBench 4的對比測試中,一加5的表現還都相對正常。因為雖然造假係統帶來了增加的用電,但基於ARM Cortex-A73的Kryo 280核心穩住了溫度。我們在GPU密集型的應用上就看到了一個完全不同的故事。就像前麵說到的,在GFXBench的Manhattan電池測試中,一加5達到了大約五十攝氏度。手機是滾燙的,拿在手裏也非常不舒服。想玩視頻遊戲或者使用類似的GPU密集型應用,50攝氏度外殼溫度是一個災難性的用戶體驗。
最後更新:2017-09-18 02:03:27