6月21日凌晨,在京東預約量已超過60萬臺的一加5正式在海外發(fā)布,驍龍835,5.5寸1080P AMOLED顯示屏,6+64G或8+128G存儲組合,1600萬+2000萬雙攝,美版479美元的起售價,國行版2999元的起售價。
除了售價比小米6高之外,相比三星、HTC等品牌,一加5依然具備不錯的性價比。然而,一直以來在國外頗有口碑的一加這次卻遭遇諸多爭議。除了外形被認為“借鑒”iPhone 7P之外,一加又一次被安卓開發(fā)者論壇XDA“掛了”。而這一次,依然是跑分作弊。
今年早些時候,XDA曾發(fā)布了一份報告,譴責一加有著針對特定跑分應用臨時拔高處理器頻率的“惡習”,在一加為大陸用戶準備的氫OS中,這已經(jīng)是一項標配的系統(tǒng)特性,而在為海外用戶而設(shè)的氧OS 里,跑分作弊的情況目前還只是在社群測試的版本中出現(xiàn)。而這種行為在當時同樣采用驍龍821的手機小米Note 2和谷歌Pixel上并未得到重現(xiàn)。
一加當時火速回應稱,未來不會在手機系統(tǒng)中再加入這樣的“功能”,而這么做的初衷也只是為了讓使用者在某些特定應用(尤其是游戲)中獲得“更加出色的體驗”。
如今,一加5再次被抓包,XDA表示,“騙我一次,算我傻;騙我兩次,算你狠!
那么XDA到底有哪些證據(jù)呢?雷鋒網(wǎng)編譯了XDA的文章,讀者可以自行判斷。
早些時候,我們就發(fā)布過一個報告,譴責了一加(以及一些其他公司)對氧OS系統(tǒng)跑分這一塊動手腳的行為。今天,我們又要很遺憾地表示,一加5手機的跑分數(shù)據(jù),又摻水分了。
在一加5正式發(fā)布的十天前,我們就收到了來自一加的樣機。在測評時,我們發(fā)現(xiàn)這款產(chǎn)品在跑分環(huán)節(jié)造假的問題。這簡直不可原諒,因為這不僅僅是在誤導消費者,更是對手機測評和媒體工作者的愚弄和褻瀆。如果一個產(chǎn)品的好評基于一份被操縱的評分,又有什么意義呢?更糟糕的是,起碼上次他們只是調(diào)整了波動和溫控,并沒有過分地拔高評分;而這次的跑分作弊就有點明目張膽,甚至無所不用其極了。
在介紹具體的細節(jié)之前,我想要嚴肅表達對一加公司一再采用這種低劣手段的失望之情。因為那些欺詐手段影響了我們的所有測試,我們暫時也不打算給出一份產(chǎn)品表現(xiàn)的全面分析。我們也會把這份報告和最后對產(chǎn)品本身的綜合評判區(qū)別開來,我們相信,通過此份報告以及與一加公司方面的溝通,那些造假的代碼不會出現(xiàn)在消費者收到的量產(chǎn)機上。當然,我們不確定這篇文章會不會影響您對機器本身的看法,我們只是提醒您關(guān)于這家公司再次的越界行為。
一加是如何操縱跑分的?
一月,在氧OS的測試版本和零售版一加3T的軟件中,我們就“挖”出了一個造假機制。當時我們認為這是氧OS和氫OS的開發(fā)團隊合并造成的,雖然有待證實,我們猜測氧OS應該已經(jīng)與氫OS共享底層代碼庫了。而一些來自一加方面的評論則在一定程度上證實了我們的猜想。至于一加5,我們發(fā)現(xiàn)了一個不同的造假機制。
下面談?wù)勊侨绾芜\作的?它的造假方式明顯又蓄意,一如我們在早期的安卓旗艦機看到過的那樣——以極具誤導性的方式,最大化跑分得分。當用戶啟動一個跑分應用時,調(diào)節(jié)開關(guān)卻像不存在一樣(至少我們看不到這種情況),小集群的最小頻率總會跳到性能監(jiān)控所見的最大頻率。所有的小核心都會“被”保持在1.9GHZ。通過這樣的造假, 一加5得到了至今為止驍龍835機器在GeekBench 4上一些最高的跑分成績,考慮到它的配置以及這樣的設(shè)置,這很有可能是可達到的最高得分。這個得分可比類似的設(shè)備和高通自己的MSM8998測試設(shè)備的得分要高得多。以下是一些受影響的跑分軟件:
AnTuTu (com.antutu.benchmark.full)
Androbench (com.andromeda.androbench2)
Geekbench 4 (com.primatelabs.geekbench)
GFXBench (com.glbenchmark.glbenchmark27)
Quadrant (com.aurorasoftworks.quadrant.ui.standard)
Nenamark 2 (se.nena.nenamark2)
Vellamo (com.quicinc.vellamo)
毫無意外,受到影響的應用和上次的應用是相同的,顯然一加公司針對的是相同的程序包。分數(shù)差異也完全在預期之內(nèi)。不過我們也有手段通過GeekBench 4來“調(diào)戲”這個造假系統(tǒng)。類似于我們在上次報告中提到的,我們發(fā)現(xiàn),當我們運行從Play Store下載的GeekBench 4的時候,該設(shè)備多核運行的得分突破了6700,而一旦我們運行隱藏式的GeekBench版本的話,得分就如所料的那樣,從未超過6500。在下圖中你可以看到運行從應用商店下載GeekBench 4時,一加5的小核心的頻率隨時間的變化,以及對比同配置下運行去除了標識符碼的GeekBench 4版本的結(jié)果。
每隔100毫秒,我們會讀取一次的CPU頻率。總的來說,如果不造假,實際上,只有24.4%的讀數(shù)反饋的最大頻率為1.9GHZ。與此同時,在不繞開造假系統(tǒng)的情況下,這個比率高達95%。這就很明顯了,一加讓CPU頻率在跑分時的頻率虛高,不僅拔高了多核測試下的跑分得分,也使得在其他CPU相關(guān)的分解測試中得到的數(shù)據(jù)不再可靠(特別對于整數(shù)和浮點運算)。這個差異在多核心測分時最為明顯,當然,也最有利。但是,單核心測分的結(jié)果則出乎意料的相似,實際上,如果不在跑分過程中作弊的話,得分反而比均值要高。
盡管如此,大多數(shù)人在討論設(shè)備跑分的時候,多核得分依然是最被考慮和關(guān)注的數(shù)字。畢竟安卓是一個高度并行的操作系統(tǒng),在多年來支持多核之后,現(xiàn)在安卓上已經(jīng)滿是支持多線程的應用,即使說只有多線程下的跑分的增分才有實際意義,這也不是跑分造假的借口,因為這對于其他沒有作弊的設(shè)備不公平。這些被操縱的跑分結(jié)果并不代表一加5的現(xiàn)實世界中的表現(xiàn),它們僅僅反映了在沒有約束的人為條件設(shè)備所能達到的一個峰值,或者說,一個實際上達不到的表現(xiàn)。
在運行GeekBench 4的時候,繞過與不繞過造假系統(tǒng),多核心測分的差距可以高達6.5%,盡管平均水平為5%左右。它可能看起來有點微不足道,但這種差距足以推動一加5“看起來”領(lǐng)先于其他搭載驍龍835的設(shè)備。在上面你可以看到一個點圖,多個獨立運行的GeekBench 4,有沒有繞過造假系統(tǒng),差別很明顯。簡單來說,人為提高CPU頻率無疑能在跑分時拿到更好的結(jié)果。下面你還可以看到一個隨著時間推移,設(shè)備表現(xiàn)和溫度變化的圖表,我們試圖確定是否會有放松溫控的情況,或者在持續(xù)的跑分過程中分數(shù)是否會出現(xiàn)差異。
我們設(shè)置了一個GeekBench 4對比組,在結(jié)果反饋在屏幕上和開啟下一次跑分中間設(shè)置了兩秒間隔,然后用FLIR熱感攝像機來測量外部設(shè)備溫度(不是根據(jù)安卓的電池溫度),在兩秒間隔內(nèi)快速進行三次測量取均值。總的來說,我挺驚訝的,這兩種設(shè)備以相同的速度升溫,并都沒有測分的下降,每項結(jié)果都在預期的波動內(nèi),說明運行中并沒有溫度控制。經(jīng)過進一步觀察,這倒算不上驚訝,因為持續(xù)性是Cortex-A73的固有優(yōu)勢之一,而驍龍835的Kryo核心正是基于此的。當然,我們在John Poole的采訪中也了解到,受影響的核心常常是高效能的核心,GeekBench 4有特別采取措施來防止熱調(diào)節(jié)對各項測分的影響。
有趣的是,并不是所有的流行的測評應用都被一加的作弊機制所鎖定。例如,在運行3DMark的時候,并沒有看到這些問題。但是,其他的像GFXBench這樣測評軟件還是被“盯著”的,我們在打開和運行它的時候看到了相同的CPU行為。事實上,在持續(xù)運行GFXBench的Manhattan電池性能測試的時候,一加5的外部溫度超過了50攝氏度,這在我以往測評過的設(shè)備中相當罕見,一般都會采取一定程度的溫度控制來防止過熱。
騙我一次,算我傻;騙我兩次,算你狠
這就有點讓人尷尬了,因為我們不得不因為廠商操縱測評的原因掛同一家公司兩次。所有一切都發(fā)生在工程機的測評環(huán)節(jié),這嚴格來說更糟了,因為這種造假旨在過度表現(xiàn)自家設(shè)備的性能,讓它顯得更好或者更快。這些準備好的把戲被在投入銷售前送到媒體面前,他們要根據(jù)從一加公司拿到的設(shè)備說結(jié)論,而許多媒體又不太愿意在測評環(huán)節(jié)指出這種造假。我們XDA一直密切注意著操縱測評的行為,因為以前就發(fā)現(xiàn)過一次,我們只是覺得最好把它告訴我們的讀者和潛在的手機購買者。
我們希望這篇文章能夠重新點燃關(guān)于測評軟件、它們的角色以及它們在當今智能手機評論中的效用的更為廣泛的討論。毫無疑問,像高通和三星這樣的公司確實關(guān)心跑分,即使在開發(fā)處理器時他們有更復雜的工具來判斷他們設(shè)備的性能,他們依然認為跑分軟件不特別完整但是有效的方式?偟恼f,只要一個人能夠理解測評的數(shù)據(jù)反映了什么結(jié)果,跑分軟件就相當有意義。我認為當下我們應該把關(guān)注放在在實際表現(xiàn)和功效的問題上,而不是原始的計算或處理能力上。當然,關(guān)于實際表現(xiàn)的瓶頸終究來源于安卓和實現(xiàn)它的OEM廠商。
話題回到一加手機,我真的不知道為什么公司的軟件團隊,在已經(jīng)被叫停過之后重新引入了操縱跑分的機制。這次更糟,它明顯地是為了蓄意拔高分數(shù)。一加5本身是個非常優(yōu)秀的設(shè)備,真的不需要用跑分作弊來做聲明。認真地說,一加5的流暢性和反應速度一直讓我很驚訝,在花了很多時間測試他們的設(shè)備,和他們管理層打交道之后,我清楚地知道他們的手機是多么的強大。但是,操縱跑分成績是一個蓄意的行為,很有可能的是,他們寧愿去惹怒一個小部分人,也要在互聯(lián)網(wǎng)上為它們的設(shè)備粉飾出一個虛高的評分。無論如何,我真誠地希望一加公司能改正,我對他們的硬件有很多話想說,可他們在我眼中已然走上了歧路。
來自一加的回應
我們之前聯(lián)系過一加公司希望他們對這篇文章表達看法,他們是這樣回應的:
人們使用跑分應用來確定他們設(shè)備的性能,而我們則希望用戶能看一加5的真實性能。所以我們讓跑分應用在接近日常使用的狀態(tài)下運行,比如資源密集型的應用和游戲。此外,當啟動應用時,一加5會運行在一個類似的狀態(tài)下,以增加應用的打開速度。我們沒有過度鎖定設(shè)備,而是在充分展示一加5的性能潛力。
這份早上剛接到的聲明讓我頗為震驚。跑分造假機制讓設(shè)備進入的狀態(tài)顯然不是什么“日常使用的狀態(tài)”,這種驚人的表現(xiàn)可不會在其他沒有刻意提高性能的應用運行時出現(xiàn)。
請記住,與競爭意義下的過度鎖定不同,大多數(shù)手機跑分應用只是用來顯示手機在日常使用中表現(xiàn)得如何。它不只是盡可能要去嘗試達到一個最高的分數(shù),而是手機在常規(guī)發(fā)熱和電池用量的情況下如何表現(xiàn)的一個試驗,這是代表手機如何日常運行的試驗。這些跑分測試并不是為了測量在現(xiàn)實世界中無法實現(xiàn)的某些“性能潛力”。
在GeekBench 4的對比測試中,一加5的表現(xiàn)還都相對正常。因為雖然造假系統(tǒng)帶來了增加的用電,但基于ARM Cortex-A73的Kryo 280核心穩(wěn)住了溫度。我們在GPU密集型的應用上就看到了一個完全不同的故事。就像前面說到的,在GFXBench的Manhattan電池測試中,一加5達到了大約五十攝氏度。手機是滾燙的,拿在手里也非常不舒服。想玩視頻游戲或者使用類似的GPU密集型應用,50攝氏度外殼溫度是一個災難性的用戶體驗。