FX168FX168

ChatGPT選股回報率高達512%! 訓練模型指令曝光 基本面交易員恐要失業?

FX168財經報社(北美)訊 投資者對人工智能的興奮使標準普爾500指數今年上漲了18%,與人工智能有關的大型市值股票在指數的漲幅中佔據了大部分。

在人們對人工智能的興奮之餘,他們也對如何進一步將人工智能融入投資領域產生了好奇。例如,隨着支持ChatGPT等服務的大型語言模型不斷改進,它們是否能夠模仿人類推理得如此出色,以至於有朝一日能取代股票交易員?

佛羅里達大學金融系認爲,通過詢問ChatGPT關於某一條新聞對股價是好還是壞,然後運行一個模擬來購買或賣空一隻股票,可以看出這些模型是否能夠理解金融市場,即使它們並沒有在這方面接受過訓練。

研究發現,儘管ChatGPT在基於新聞情感預測股票走勢方面表現出色,但它並非沒有侷限性。事實上,像ChatGPT和Bard這樣的生成式人工智能服務明確警告用戶不要依賴它們進行金融建議,而是要進行自己的研究。

這項研究由金融學助理教授Alejandro Lopez-Lira和艾默生美林副教授Yuehua Tang領導,旨在評估ChatGPT是否能夠理解新聞對股市走勢的影響,從而產生收益,並且是否能夠與甚至勝過人類。

他們輸入了涉及股息支付到CEO公告等各種主題的新聞標題。公司列表來自於研究證券價格中心的數據庫。新聞標題是從網上獲取的,然後與數據提供商RavenPack的數據進行比較,以確保它們只使用相關的新聞。

研究人員讓ChatGPT爲新聞標題分配以下分數:「1」表示好消息,「0」表示未知,而「-1」表示壞消息。那些得分爲「1」的將被購買,而「-1」將通過在Linux中使用Python代碼進行自動賣空。對於「0」輸出不採取任何行動。ChatGPT以51%的概率猜對了正確的結果。Lopez-Lira表示,儘管這個利潤率較低,但由於它將交易隨時間和頻率累積起來,累積的回報是顯著的。

該研究於4月份進行,作爲對2021年10月至2022年12月的交易日進行前向測試。由於GPT-3.5是使用直到2021年9月的數據進行訓練的,LLM在那之後並不知道股市發生了什麼,這使得Lopez-Lira和Tang能夠測試其預測能力。

Lopez-Lira表示,他們的策略是在紐約證券交易所和納斯達克交易的任何股票上進行交易。然而,大部分收益來自小市值股票,因爲小型股票的交易成本更高,因此更少的投資者交易它們,創造了更大的機會窗口來利用新聞。

在這個期間,由GPT-3.5的情感分析指導的多空策略將1美元變成了6.12美元,產生了512%的回報。同樣,GPT-4策略在同一期間將同樣的金額增加到3.76美元,獲得了276%的回報。對GPT-3.5進行的第二次模擬考慮了5到25個基點之間的交易成本,導致收益分別降至380%和50%。相比之下,羅素2000指數在同一期間下跌了20%。

Lopez-Lira指出,從總回報的角度來看,早期的模型優於後者,但在風險調整回報方面卻不如後者。「主要是因爲GPT-3.5更爲激進,因爲我們給了它選擇不知道這條新聞是好還是壞的選項,所以GPT-3.5更喜歡回答更多這樣的問題。」

此外,研究發現較早版本的語言模型,包括GPT-1、GPT-2和BERT,在將信息翻譯成足夠準確以進行盈利交易方面表現不佳。這表明隨着語言模型的改進,準確性可能會提高。

使用的關鍵指令:

「忘記以前的所有指令。假裝你是一位具有股票推薦經驗的金融專家。如果是好消息,請回答‘YES’;如果是壞消息,請回答‘NO’;如果不確定,請回答‘UNKNOWN’。然後在下一行用一句簡短而簡明的話詳細說明。這則標題對(公司名稱)的股價有好壞之分嗎?」

以下是標題和ChatGPT的響應示例:

標題:「Cadence Design 股價在財報公佈後飆升,分析師持樂觀態度」

ChatGPT:「YES,積極的收益報告和樂觀的分析師展望可能會在短期內推動對Cadence Design股票的需求上升。」

標題:「Philip Morris公司季度業績好於預期,但下調了預期」

ChatGPT:「NO,儘管超過季度預期,但由於業績前景不佳,Philip Morris International的股價可能會在短期內下降。」

標題:「Plexus Worldwide晉升Gene Tipps爲全球運營總裁」

ChatGPT:「UNKNOWN」目前尚不清楚Gene Tipps晉升爲全球運營總裁將如何影響Plexus的股價。

Lopez-Lira表示:「我們要求它考慮價格走勢並提供簡短的解釋,我們讓它系統地輸出這些答案。可以說,所有這些回答我都會打‘A’。所有的解釋都是明智而合理的。」

華爾街的ChatGPT

Lopez-Lira表示,從好的方面來說,這些語言模型可以使分析師的工作變得更輕鬆、更高效,因爲它們可以快速消化大量信息。

隨着新的人工智能模型的出現,它們可以提高市場效率,因爲它們可以加快對新聞的響應時間。這個時間範圍被稱爲機會之窗,即交易者必須先於其他人利用新聞的時間。

初步研究集中在日內交易上。但Lopez-Lira認爲,隨着越來越多的公司使用這些工具,利用信息的機會之窗將從一天縮短到分鐘,甚至秒,使得人類無法在高頻交易中手動利用信息。他補充說,零售交易者已經很難反對大型機構算法。人工智能只會使情況更加困難,導致機構和零售交易者之間的差距加大。

Lopez-Lira認爲,這些先進的能力也可能對機構交易者產生反作用:隨着越來越多的公司將人工智能工具整合到他們的交易實踐中,可預測性將會下降,因爲他們在相同的空間競爭,用類似的模型分析數據。他表示,隨着時間的推移,他們的競爭優勢將會減弱。

有經驗的零售交易者普遍避免與機構算法對賭。根據《Insider》查看的交易記錄,David Capablanca是一位做空者,在2021年2月至2023年4月間,他的獲勝率高達90%。他表示,如果察覺到算法交易正在執行,他將不會交易小市值股票。他也不會對持有40%以上機構所有權的股票進行下注。

現實世界的陷阱

Lopez-Lira表示,如果你想使用ChatGPT進行實際交易,你可能需要爲其提供更多的背景信息。

這正是私募股權公司Praefinium首席執行官Alpesh Patel在測試GPT-4實時選股能力時所做的。他向模型提供了終端數據點,包括營運資金、自由現金流轉換和債務等30個道瓊斯股票的許多其他變量。這使得語言模型能夠篩選出它預計在未來12個月內表現良好的前5只股票。它選中了帕特爾已經持有的3只股票,同時建議了兩隻基本面同樣強勁的股票。

David Capablanca經常權衡頭條新聞是股票走勢的催化劑。但這只是他在做空任何股票之前運行的9個檢查表中的一項。做空賣家必須考慮許多其他因素,以避免潛在的災難。這些災難的一個主要原因是市場摩擦,或可能干擾迅速執行交易的因素,這是模擬沒有考慮到的。

有時經紀商不會立即執行您的訂單,或者找不到股票可供借用。由於在做空交易中,您必須借用、購買,然後出售,因此與作爲人類交易者的David Capablanca相比,存在更多的摩擦點可能減緩交易速度。然而,ChatGPT沒有這些摩擦點,因爲它不需要等待經紀商借給它一隻股票或執行其交易,因此它能夠比普通人更快地利用做空交易。

Lopez-Lira指出,這意味着在現實世界中,負面新聞的影響更大且更持久,可能使ChatGPT處於優勢地位。

David Capablanca將GPT嘗試做空任何股票的嘗試與不考慮流通量規模的現實情況進行了比較,他表示:「最明顯做空的股票,價格達到100美元,然後跌至零,你甚至無法做空。除此之外,它也沒有考慮到擠壓。那麼,如果你用一定數量的資金做空這些股票,你有多少收到追加保證金通知?」

David Capablanca還指出了真實世界中可能使交易者陷入困境的交易停牌的風險。此外,還存在隔夜持有做空頭寸的風險,儘管模擬中存在這種情況。在盤後交易中,可能發生差距上漲或價格高度波動的情況。這可能導致做空擠壓,進而引發追加保證金的通知。

Lopez-Lira指出,至於大型機構投資者,他們需要考慮價格影響,即在大量交易推動股價變動時發生的情況,這在較小市值的股票中更有可能發生。

流動性不足是實時交易中可能減緩交易的另一個摩擦區域。流通股較少的股票由於供應或需求的限制更難進出,這可能導致更大的價差。

交易教育網站Trading.biz的分析師Cory Mitchell表示,如果所做的空頭頭寸有足夠的成交量,並且可以做空,那麼該模型是強大的,因爲它顯示出巨大的超額表現。如果將該研究的表現與同一時期的標普500指數進行比較,該模型上漲了500%,而指數下跌。而且,回撤也比指數小,這是非常令人鼓舞的。

Cory Mitchell補充道:「在這項研究中,等權重的市場投資組合在某一時刻曾經出現36%的回撤。而他們的投資組合則下跌了22.79%,所以,相對於指數型投資組合,回撤小了三分之一。」

儘管這項研究存在缺陷,但David Capablanca表示,出於信息目的,交易者必須及時瞭解這些進展,這一點很重要。

David Capablanca在談到人工智能工具時表示:「瞭解它們已經取得了多大的進展是件好事,因爲將來會很好用。我不想一無所知。這就像2005年的計算機一樣,如果你一直忽視計算機,直到現在,你會落後,因爲最終,他們會弄明白的。」


來自 FX168 的更多新聞

更多新聞