大模型成私人導遊,一鍵規劃Citywalk,港大MIT聯合出品
現在,大模型可以做私人導遊,爲你規劃Citywalk路線了——
港大MIT等單位聯合推出ITINERA,將LLM與空間優化相結合,實現個性化的開放域城市行程規劃。
舉個栗子,用戶輸入“給我規劃一條包含‘鉅富長’、以靜安寺爲終點的citywalk路線”。
ITINERA系統立馬生成了一條包含若干地點的路線,並提供了相應的介紹文本。
甚至“適合情侶一起去的酒吧”“二次元聖地”“途經網紅打卡點”這樣的個性化需求,ITINERA也可以理解和滿足。
單看可能沒感覺,咱們直接對比ITINERA(左側)和GPT-4 CoT生成的路線。
同一提示詞:“我想要一個文藝的路線,要經過橋和渡輪。”
可以看到,ITINERA生成的行程會經過蘇州河沿岸的幾座橋和黃浦江渡輪,在文藝的朵雲書店結束,並且路線較爲合理,將地點集中在兩個空間聚類中。
而右圖中GPT選擇的POI(個人偏好的興趣點)則與用戶要求的橋和渡輪不太相符,還出現了繞路、POI距離過遠的情況。除了這個例子外,GPT有時還會出現幻覺,生成不存在的POI。
概括而言,ITINERA具有以下特色:
ITINERA在四個城市的旅行行程數據集(1233條熱門城市路線、7578個POI)上進行了訓練評估。
結果顯示,它可以生成比傳統行程規劃、直接使用LLM等方法更優的效果。
目前相關論文已被KDD Urban Computing Workshop (UrbComp) 2024收錄。
五大模塊組成ITINERA
下一個問題來了:咋做到的呢?
如下圖所示,ITINERA由大模型驅動的五個模塊組成。
首先, User-owned POI Database Construction(UPC)模塊從社交平臺上的旅遊內容中收集、構建用戶興趣點數據庫。
爲了規劃符合用戶請求的行程,Request Decomposition(RD)模塊對用戶的偏好進行解讀和整理,轉換爲結構化的數據形式。
Preference-aware POI Retrieval(PPR)模塊將會根據用戶偏好進行檢索,獲取最相關的若干個興趣點。
爲了確保行程在空間上連貫,作者採用了Cluster-aware Spatial Optimization(CSO)模塊,通過解決分層旅行商問題來空間過濾和排列檢索的興趣點。
最後,Itinerary Generation(IG)模塊將候選興趣點集與多個約束相結合,使用大模型生成既空間合理又符合用戶請求的旅行路線及相關描述。
原理摸清了,ITINERA實際表現如何呢?
爲了搞清這個問題,作者收集了來自四個城市的旅行行程數據集,包括用戶請求、相應的城市行程路線以及詳細的興趣點(POI)數據。
通過POI的召回率(RR)、總路程與理論最短路徑的差值(AM)、路線中的交叉點個數(OL)、未知POI比例(FR)等客觀指標,評測個性化推薦POI的準確度、與用戶請求的匹配度,以及生成路線的空間合理度。
甚至爲了解決興趣點吸引力、用戶請求匹配度等方面無法量化的問題,作者還採用了LLM自動評估POI的質量、路線的質量、行程和用戶請求的匹配程度。
可以看到,與GPT-3.5、GPT-4和GPT-4 CoT等其他方法相比, ITINERA系統在所有指標上均表現更好。
在用戶和專家評估的POI質量(POI Quality)、行程質量(Itinerary Quality)和匹配度(Match)方面,ITINERA系統也獲得了更高的評分。
總體來說,ITINERA能夠從自然語言請求直接生成個性化、空間連貫的citywalk行程,不僅探究了大模型時代的開放域行程規劃問題,還提供了在城市應用中利用大模型解決複雜空間相關問題的思路。