競爭關係經常違反傳遞性和對稱性的規則。這使得它成為我們在CB Insights麵臨的最棘手的數據科學/機器學習問題之一。188bet游戏
我們在CB Insights遇到的最困難的數據挑戰之一是建立一個識別競爭對手的算法。188bet游戏
雖然我們在客戶看到競爭對手關係之前,就將算法建議增強並交付給內部團隊,但我們的願望是構建一個算法,以足夠高的保真度(接近完美)完成這項工作,不需要人工協助。
這很有挑戰性,原因有很多。競爭對手的關係:
- 經常違反及物性
- 通常是不對稱的
違反了傳遞性-所以如果A是B的競爭對手,B是C的競爭對手,那麼A不一定是C的競爭對手。例如,Lyft是Uber的競爭對手,Uber是Grubhub的競爭對手,但Lyft和Grubhub不是競爭對手。
但是違反傳遞性並不是唯一的問題。
不對稱競爭關係-有時候,A公司認為B公司是競爭對手,但B公司並不認為A公司是競爭對手。或者公司A隻是競爭對手B的一個特征,在這種情況下,如果你問A和誰競爭,人們可能會說B,但如果你問B的競爭對手是誰,就不會出現A。
以軟件即服務供應商Mindbody為例,該公司生產健身、健康和健身房管理軟件。該公司的產品之一是麵向客戶的銷售點設備。Square是它的競爭對手。但考慮到Mindbody專注於垂直領域,你可能不同意它是Square的競爭對手。
不管你在這個問題上的立場如何,這一點都是可以爭論的。
不對稱不僅僅來自於對產品/客戶的關注——正如身心/廣場的例子所強調的那樣。
地理位置也會影響不對稱性。中國的在線鞋類零售商是否與美國或印度的競爭?
有時,即使核心業務相同,公司所處的階段也會造成不對稱的競爭關係。
以阿裏巴巴(Alibaba)和雅米買(Yamibuy)為例:這兩家公司都從事電子商務,目標都是亞洲市場。但Yamibuy是一家瞄準阿裏巴巴的早期初創公司,因此,雖然該公司可能將阿裏巴巴視為競爭對手,但在其規模達到表明他們是真正的競爭對手之前,尚不清楚是否應該被列為阿裏巴巴的競爭對手。
這些類型的不對稱競爭關係使這個問題變得更加有趣(和困難)。
當然,我們可以嚐試用人類來解決這個問題,但這是行不通的,原因如下:
- 當試圖為成千上萬的公司做這件事時,成本很高,規模也很難擴大
- 它需要領域知識,特別是在生物技術或企業軟件等領域
- 隨著時間的推移,企業往往會微妙地改變產品和關注領域,從而導致競爭對手的變化。這些變化的數量、速度和種類是人類策展人無法掌握的
我們識別競爭對手的模型是現有模型中最複雜的。它使用了各種各樣的信號,從搜索數據到媒體中的共同提及,到關鍵字描述重疊,以及大量其他因素。但是,我們還沒有為客戶提供沒有經過某種程度的人工審查的算法建議——也就是說,它們不能被直接推向生產。
如果你覺得這個問題很有趣,或者已經解決了類似的挑戰,我們會積極應對招聘我們的工程和數據科學/機器學習團隊.
順便說一句,了解更多關於我們的算法有預測未來獨角獸的準確率為48%.(供參考,沒有VC有這樣的命中率)