競爭關係經常違反傳遞性和對稱性的規則。這使得它成為我們在CB Insights所麵臨的最棘手的數據科學/機器學習問題之一。188bet游戏
我們在CB Insights遇到的最困難的數據挑戰之一是構建一個識別競爭對手的算法。188bet游戏
雖然我們增加並向內部團隊提供算法建議,以便在客戶看到它們之前管理競爭對手的關係,但我們的願望是構建一個算法,以足夠高的保真度(接近完美)完成這項工作,從而不需要人工協助。
這是具有挑戰性的,原因有很多。競爭對手的關係:
- 經常違反傳遞性
- 通常是不對稱
違反了傳遞性-所以如果A是B的競爭對手,B是C的競爭對手,A不一定是C的競爭對手。例如,Lyft是Uber的競爭對手,Uber是Grubhub的競爭對手,但Lyft和Grubhub不是競爭對手。
但是違反傳遞性並不是唯一的問題。
不對稱競爭對手關係有時候,A公司把B公司視為競爭對手,但B公司並不認為A公司是競爭對手。或者公司A隻是競爭對手B的一個特征,在這種情況下,如果你問A的競爭對手是誰,人們可能會說B,但如果你問B的競爭對手是誰,A不會出現。
以軟件即服務供應商Mindbody為例,該公司生產健身、健康和健身房管理軟件。其產品之一是麵向客戶的銷售點設備。Square是它的競爭對手。但鑒於Mindbody專注於垂直領域,你可能並不認為它是Square的競爭對手。
不管你在這個問題上的立場是什麼,這是一個可以爭論的觀點。
不對稱不僅僅來自於產品/客戶的關注——正如“身心/正方形”的例子所強調的那樣。
地理位置也會影響不對稱。中國的在線鞋業零售商會與美國或印度的在線鞋業零售商競爭嗎?
有時,即使核心業務相同,公司所處的階段也會造成不對稱的競爭關係。
以阿裏巴巴和亞米買為例:兩者都從事電子商務,目標是亞洲市場。但Yamibuy是一家瞄準阿裏巴巴的初創公司,雖然Yamibuy可能認為阿裏巴巴是其競爭對手,但在Yamibuy的規模達到真正的競爭對手之前,尚不清楚它是否應該被列為阿裏巴巴的競爭對手。
這些類型的不對稱競爭關係使得這成為一個更加有趣(和困難)的問題。
當然,我們也可以嚐試著讓人類去解決這個問題,但這是行不通的,原因如下:
- 當試圖為成千上萬的公司做這件事時,它是昂貴和困難的
- 它需要領域知識,特別是在生物技術或企業軟件等領域
- 隨著時間的推移,企業會改變產品和關注領域,通常是微妙的,這導致了競爭對手的變化。這些變化的數量、速度和種類是人類策展人無法掌握的
我們識別競爭對手的模型是所有可用模型中最複雜的。它使用了各種各樣的信號,從搜索數據到媒體中的共同提及到關鍵詞描述重疊,以及大量其他因素。但是,我們還沒有達到向客戶提供沒有經過某種程度的人工審查的算法建議的地步——也就是說,它們不能直接投入生產。
如果你覺得這個問題很有趣,或者已經解決了類似的挑戰,我們會積極應對招聘我們的工程和數據科學/機器學習團隊.
順便說一下,了解更多關於我們的算法預測未來獨角獸的準確率為48%.(供參考,沒有VC有這樣的命中率)