作者:郭華
今年六月距去年六月正好一年。
去年六月,Cloudera發(fā)了FY20Q1財報,營收以微小差值不及分析師預期,股價當天跌去40%。
今年六月,Cloudera發(fā)了FY21Q1財報,對比去年,營收增長12%,利潤增長44%,大客戶和訂閱服務占比也穩(wěn)定增長,均超分析師預期,于是股價一路上漲,疫情中逆勢重回高地。
從股價來看,Cloudera這一年的表現(xiàn)就像坐了一次過山車,不過解讀財報非我所愿,對趨勢做技術分析更非我所擅長,但對于這個現(xiàn)象,我倒有些關于“基本面”的話想說一說。
去年六月,在Cloudera股價暴跌的時候,大家找到了三個問題:
1) Cloudera所賴以生存的Hadoop氣數(shù)已盡;
2) Cloudera公司合并了Hortonworks,兩者的產品線不同,整合困難;
3) Cloudera在云時代毫無作為,已被拋棄;
這三個問題在程度上雖然有夸張的成分,但不完全是空穴來風,關注點也非常準確。所以所謂的“基本面”,其實就是看看Cloudera到底把它們解決掉了沒有。
1. Hadoop已死,Hadoop長存
很早的時候,大概比Cloudera股價暴跌2019年還早那么五六年,很多人便開始宣稱Hadoop已死,Spark出來后Hadoop已死,Elasticsearch出來后Hadoop已死,甚至MongoDB出來后Hadoop也已死。
作為一個2011年開始接觸Hadoop,并至今還賴以為生的IT中年,我對Hadoop已死的論調十分不感冒。實際上只需幾個問題便能停止這種毫無根據的假想:有幾家公司做大數(shù)據不用Hadoop?Hadoop是否有替代方案?如果有的話,難度是不是小于Elasticsearch或Spark或Mongo或其他?
我更能接受的一種說法是,Hadoop里某些組件已經有了的替代品,比如Spark、Flink 之于 MapReduce,云存儲之于HDFS,K8S之于YARN。而且我認為比起Hadoop已死的暴力論斷,這種說法更為實際,也更值得Cloudera擔心。
那Cloudera是怎么解決這個問題的?
他沒有解決。
真的,他沒有反駁和抗拒技術本身的衰落,反而承認了這一點。他說技術就是不停的處于打破與被打破的循環(huán)之中,而他們要做的是把Hadoop發(fā)展成一個生態(tài),讓那些更先進的技術,最終成為這個生態(tài)的一部分,老的如Hive、Hbase,新的像Spark、Flink,現(xiàn)在都是Hadoop生態(tài)的一部分,總體不下40個。
就像一片森林,局部有枯萎有新生,但整體看斗轉星移,生生不息。
借用他們的一張PPT來看,大概是下邊這樣。
(圖片來自Cloudera大中華區(qū)總經理徐晉在InfoQ的分享)
這是一種擁抱變化的哲學。
如果這樣看的話,你不得不承認Hadoop反而有比其他開源軟件更強的生命力。因為雖然大家都有意無意在朝這個方向努力,比如Elasticsearch上的ELK、Kafka上的KSQL和Kafka Streams,但能做成一個生態(tài)的,目前看,恐怕只有Hadoop。
而且從另一方面來看,很多廠商提供的Hadoop部分替換方案也無一例外會兼容Hadoop接口,所以哪怕Hadoop自身所有軟件都衰落了,被完全替換了,Hadoop也能作為一種標準繼續(xù)存在。
Hadoop已死,Hadoop長存。
2. Cloudera產品線合并
全新的Cloudera由老的Cloudera和Hortonworks合并而來。
在合并之前,兩者的產品雖然都基于Hadoop,但理念和具體組件并不一致。Cloudera的產品叫CDH,采取了Open Core+閉源組件的商業(yè)模式,在開源Hadoop上加了一些自研產品,比如管控平臺。Hortonworks的產品叫HDP,組件和商業(yè)模式都采取了全開源的模式。
所以合并后的第一大問題就是產品策略的問題。
為此,Cloudera做了大刀闊斧的改革。
一方面,Cloudera保持對原CDH和HDP的支持直到2022年,給這些客戶一個平滑的過渡期。另一方面,Cloudera也推出了整合性的新產品,并且孤注一擲的表示2022年以后,全部客戶都會轉移到這個產品上來。
這個新產品便是CDP。
CDP全稱為Cloudera Data Platform。按照Cloudera CPO Arun Murthy的說法,CDP會在CDH6和HDP3的基礎上進行整合,把兩條產品線里最好的組件拿出來,在保證兼容性的前提下,給客戶更好的體驗。
在這個基礎上,Cloudera也改變了自己的商業(yè)模式。
2019年7月,Cloudera發(fā)表了一篇文章,題為《我們對開源的承諾》,表示會把原來的閉源組件全部開源,比如Cloudera Manager,Cloudera Navigator和Cloudera Data Science Workbench(“CDSW”)等,而且這個決定在所有新發(fā)版本上全部有效,包括老的CDH、HDP和CDP。
該決定的執(zhí)行期為6個月,現(xiàn)在已完成。
現(xiàn)在Cloudera把所有產品都托管到了Apache基金會,在AGPL 和 Apache 2.0 兩種許可下進行開源,并以訂閱的形式向客戶收取軟件和服務費用。
這是Cloudera新商業(yè)模式,也是紅帽的商業(yè)模式。早在2013年的時候,Cloudera的第一任CEO Mike Olson就曾表示,雖然開源軟件蓬勃發(fā)展,但其背后的商業(yè)公司卻難以獨立生存,要么消失要么被收購,比如IIIustra、Informix、Sleepycat、Mysql、SpringSource、JBoss……實際成功的只有一家,就是紅帽。
所以并不意外。
那效果怎么樣?
從FY21Q1財報來看,訂閱服務收入1.871億美元,占總體的89%,同比增長21%,超過總體增幅,同時毛利率也提高到了85%。這意味著訂閱服務已經成了其營收的主力,而且在帶動整體向上突破。
與此同時,Cloudera的客戶數(shù)也在增加。
FY20Q2的財報中, Cloudera的大客戶(年化經常性收入大于10萬美金)數(shù)增長了24個,達到953個。而到了FY21Q1的財報,這個數(shù)字已經到了1004。要知道一年前Cloudera的暴跌就和客戶數(shù)有關,在FY20Q1的財報電話會議上前 CEO Tom Reilly曾親口承認產品線的分歧影響了客戶拓展,確實某些客戶因為等待產品線的整合而推遲了續(xù)費。
所以從這兩點看,Cloudera在產品線上的整合可以說是成功了。
3. 與云共生
過去的一年是Cloudera在云計算上猛追猛趕的一年。
北宋有位“半部論語治天下”的名相趙普,在宋太宗趙匡義繼位時,他曾上書說,“中國既安,群夷自服。是故夫欲攘外者,必先安內! 自此以后,“攘外必先安內”就流傳了下來,成了歷代統(tǒng)治者面臨內憂外患時的首選策略,直到九一八事變后,還在被國民政府反復強調。
這句話用來形容Cloudera或許也是貼切的。
因為Hadoop社區(qū)之前一直在內戰(zhàn)。Hadoop萌芽自Doug Cutting個人,但成長于雅虎。在Hadoop基礎上,有兩家主要開源獨立開源商業(yè)公司,就是Cloudera和Hortonworks,兩家在開源社區(qū)的貢獻幾乎相當,雙方不僅在爭奪市場,也在爭奪開源Hadoop的控制權。這種分裂牽扯了太多精力,以至于一不注意就讓云廠商直接用開源Hadoop收割掉了大部分企業(yè)上云的紅利。
所以有這樣一種魔幻般的現(xiàn)實,一邊是Hadoop已死,一邊是各大云廠商拿Hadoop瘋狂賺錢。據分析師測算,單2018年AWS的EMR就產生了2.5億美金的營收,而該產品介紹就是“Hosted Hadoop framework“。而這并不是孤例,除AWS的EMR外,谷歌云有Dataproc,Azure有HDInsight,阿里云有E-MapReduce,云計算四巨頭,在收割Hadoop開源紅利面前,無一缺席。
所以如果說產品線合并是內憂的話,那云廠商就是外患了。
不過云廠商并不是在針對Hadoop,云只是在崛起,并在崛起之路上順帶吞噬了遇到的東西,不僅包括Hadoop,也包括其他開源軟件。
MongoDB 的 CEO這樣描述道:“每當一個新的開源項目變得非常流行時,云提供商就會剝奪我們的技術,將免費軟件放在他們的平臺上,然后從中獲取大部分(如果不是全部)價值,但幾乎不回饋開源社區(qū)”。
只要用戶上了云,那他幾乎只能選擇云廠商提供的開源服務,而上云恰恰是過去十年企業(yè)IT的主旋律。這讓開源原廠十分憤怒,Redis CEO 直言:“多年來,我們就像個傻子一樣,他們拿著我們開發(fā)的東西大賺了一筆”。
于是他們紛紛開始采取行動,一方面修改開源協(xié)議,禁止云廠商提供托管服務(只針對部分組件有效),另一方面也在積極發(fā)展自己的獨立云服務,比如Confluent的Confluent Cloud、Elastic的Elastic Cloud,以及Cloudera的CDP。
他們怒斥公共云廠商為吸血鬼,而且準備以反壟斷名義提起訴訟。
不過好在云廠商也不是鐵板一塊,比如谷歌就從中看到了超越AWS的機會。他旗幟鮮明的表示支持開源,并在2019年引入了7家開源軟件供應商,通過谷歌云售賣他們的商業(yè)服務,準備打造一個Open Cloud。
大部分云廠商都有一個MarketPlace可以售賣其他公司開發(fā)的軟件,而谷歌云的特別之處在于,他引入的開源廠商都會有內部的團隊來對業(yè)績負責。比如引入Confluent(kafka)的就是谷歌自己的Pub/Sub產品團隊,兩者功能和場景上類似,只不過一個自研,一個開源。按照谷歌的說法,在同一個云平臺上提供這兩個產品,旨在“滿足用戶的不同選擇傾向”。
在這種情況下,開源原廠的獨立云服務變得實際起來,他們可以和不同的公共云合作,在不同的云上售賣自己的產品,同時維持獨立入口,與云共生。
Cloudera的CDP也是如此。
CDP不僅是原CDH和HDP兩條產品線的結合體,也有支持多云的共有云版本,同時也有私有云/混合云等多種運行環(huán)境。
而且CDP的開發(fā)速度也十分快,2019年初公布計劃,幾個月后產品發(fā)布,目前已經完成了在AWS、Azure上的版本,谷歌云版本下半年面市。實際上多云不僅是Cloudera應對云廠商威脅的手段,從客戶的需求看,其本身也有不可替代的價值。隨著云滲透率的提高,被云綁定成了一個切實的擔憂,讓很多客戶在上云的同時尋找Plan B。比如把應用部署在多個云服務商,或者自建機房。CDP就是這種需求下的產物,通過CDP,客戶可以把自己的大數(shù)據服務部署到AWS、Azure或谷歌云上,無縫切換,消除了被某個云廠商綁定的問題。
而且Cloudera最近還推出了CDP私有云,在K8S基礎上把存儲和計算做了分離,讓客戶應用可以在公有云與公有云,公有云和私有云之間無縫切換,構建一個“以數(shù)據為中心,面向多云的私有云平臺”。
短短一年時間,Cloudera以驚人的速度完成了一場蛻變,曾被人詬病在云時代毫無作為的他,儼然看齊并領先起了潮流。
4. 總結
這便是Cloudera股價過山車背后的基本面,他孤注一擲的CDP不管從計劃還是執(zhí)行上都表現(xiàn)的足夠亮眼,以一個產品解答了曾被人詬病的多個問題。從這個角度來看,可以說他轉型成功了,至少也走在了成功的路上。
再沒有人像去年那樣,用洋槍隊圍觀神拳義和團的姿態(tài),詢問他將何去何從。
只是對他來說,過去的這一年似乎有些漫長。