加拿大pc28官网开奖网址 用大模子吃瓜更智能了!阿里通义实验室提议新时期线纪念框架,全面普及新闻纪念效力

2024-12-29 19:21 103
洞开域和阻塞域TLS都更高效了

当今加拿大pc28官网开奖网址,大模子不错帮你梳理新闻时期线了,以后吃瓜就更通俗了!

AI Agent的风,我们赛博乐子东谈主也得吹吹。

这即是来自阿里巴巴通义实验室与上海交通大学的新磋商,他们提议了一种基于Agent的新闻时期线摘要新框架——CHRONOS。

它不仅不错帮你从海量新闻中纪念出遑急事件,更遑急的是,它还不错梳理出明晰的时期线,以后上网冲浪时千般复杂事件都一目了然。

其中的CHRONOS一词取自希腊外传中的时期之神柯罗诺斯。

该框架通过迭代多轮的自我发问形状,聚拢检索增强生成时候,从互联网上检索有关事件信息,并生成时期限定的新闻摘要,为新闻时期线摘要生成提供了一种全新的处置有野心。

先来一谈瞅瞅几个例子。

比如对于新闻“国足1-0巴林”,CHRONOS粗略纪念海量新闻,呈现事件的一脉相承。

对于隐私时期更长的新闻“中国探月工程”,CHRONOS也能聚焦重隐衷件,呈面前期线发展,使得用户粗略一目了然。

补皆洞开域TLS短板

时期线纪念(Timeline Summarization, TLS)任务是一种当然讲话处理规模的经典时候挑战,它旨在从重大文本数据中提真金不怕火关节事件,并按时期限定陈列,以提供对某一主题或规模历史发展的结构化视图。

举例,在新闻规模,时期线纪念不错匡助用户快速了解一个新闻事件的一脉相承。该任务不仅条款识别出遑急的事件,还需要合资事件之间的时期关连和因果连络,以便生成一个连贯、精真金不怕火且信息丰富的时期线摘要。

左证可检索事件的开首,不错将TLS任务细分为阻塞域(closed-domain)和洞开域(open-domain)两个设定:在阻塞域TLS任务中,时期线是从一组预界说的、与特定主题或规模有关的新闻著述中创建的,而洞开域TLS指的是从互联网上径直搜索和检索新闻著述来生成时期线的进程。

夙昔的职责东要蚁集于处置阻塞域上时期线生成问题,而洞开域TLS则需要重大的信息检索和筛选才能,以及在莫得全局视图的情况下识别和成就事件之间连络的才能,为这项任务提议了新的要乞降挑战。

迭代检索的CHRONOS框架

为了应付上述挑战,团队提议CHRONOS框架,通过迭代发问进行有关事件检索,生成准确、全面的时期线摘要,粗略有用地处置洞开域和阻塞域两种设定下的TLS任务。

1. 动机

时期线生成的中枢在于成就事件之间的时期和因果关连。

每个新闻事件都不错被示意为一个不同的节点,任务的标的是成就这些节点之间的边,以展示它们的有关性,并最终酿成一个异构图,从主题新闻的节点最先。

因此,通过一个检索机制来检索有关的新闻著述,不错有用成就这些边,酿成事件之间的连络。

2. 综合

CHRONOS专揽大模子的才能,通过模拟东谈主类信息检索的进程,即通过提议问题、基于检索截至进一步提议新的问题,最终蚁集对于有关事件的全面信息并纪念为时期线。

CHRONOS包括以下几个模块:

自我发问 (Self-Questioning):领先搜索粗粒度的新闻配景信息,然后迭代地提议问题,以检索更多有关新闻。

问题改写 (Question Rewriting):将复杂或弘扬欠安的问题明白为更具体、更易检索的查询。

时期线生成 (Timeline Generation):通过销亡每一轮检索生成的时期线走动首一个特等遑急事件的时期线。

3. 自我发问3.1 粗粒度配景调研

在自我发问的启动阶段,CHRONOS使用标的新闻的标题看成关节词进行搜索,以蚁集与标的新闻最径直有关的信息。

这些信息组成了新闻配景(News Context),为自我发问打下初步基础。

3.2 发问示例遴荐

在粗粒度配景调研之后,CHRONOS专揽大模子的高下体裁习才能,通过极少样本指示来携带模子生成对于标的新闻的问题。

为了评估问题样推行量,引入了时序信息量(Chrono-Informativeness, CI)的认识,用来猜度模子提议的问题检索与参考时期线对皆事件的才能,即高CI值的问题更有可能相通检索到与标的新闻事件有关的著述,用检索生成的时期线和参考时期线中包含日历的F1分数进行猜度。

基于最大化问题集时序信息量的标的,构建一个“新闻-问题”的示例池,用于携带新标的新闻的问题生成。

对于每个新的标的新闻,通过余弦相似性动态检索与标的新闻最相似的样本,确保了样本的高下文有关性和时期信息的准确性。

3.3 迭代发问

CHRONOS通过连气儿迭代发问,冉冉长远探索事件的细节。

每一轮迭代都基于前一轮的检索截至,以发现新的问题和信息,直到温顺时期线中事件数目或达到最大迭代次数。

3.4 问题改写

查询改写(Query Rewriting)是检索增强生成中常用的优化智力。

在CHRONOS框架中,团队通过对启动发问阶段产生的平淡或复杂问题改写为2-3个更易于检索的子问题,粗略生成更具体、更有针对性的查询,从而提高搜索引擎的检索成果。

他们一样在指示中加入极少样本,携带大模子进行有用改写,将复杂问题转动为更具体的查询,同期保握问题的原始意图。

3.5 时期线生成

CHRONOS通过两阶段生成齐全的时期线纪念:生成(Generation)和销亡(Merging)。

生成:通过分析每一轮检索到的新闻著述来识别关节事件和贯注信息。专揽大模子的合资和生成才能,提真金不怕火每个事件的发生辰期和有关细节,并为每个事件撰写精真金不怕火的容貌。这些事件和容貌被组织成初步的时期线,按照时期限定陈列,为后续的销亡阶段提供基础。

销亡:将多轮检索生成的初步时期线整合成一个连贯的最终摘要。这一进程波及对皆不同时期线中的事件、处置任何日历或容貌上的防碍,并遴荐最具代表性和遑急性的事件。

全新数据集OPEN-TLS

为了评估TLS系统,磋商团队还蚁集了由专科记者撰写的对于近期新闻事件的时期线,构建了一个名为Open-TLS的新数据集。

与以往阻塞域的数据集比拟,Open-TLS不仅在数据集限度和内容上愈加千般化,隐私政事、经济、社会、体育和科学时候等多个规模,况且在时效性上更具上风,为洞开域TLS任务提供了一个更全面和更具挑战性的基准。

婆婆说这扇大门花了1万多,看着很普通的样子居然却这么贵,我有点吃惊啊!

为什么这么说?我们一起来看看它的优点和缺点就明白了。

实验截至

1. 实验设定

实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B分袂构建CHRONOS系统,评测洞开域和阻塞域两个设定下TLS的性能弘扬。使用的评估主张主要有:

ROUGE-N: 猜度生成时期线和参考时期线之间的N-gram重迭。具体包括:(1)Concat F1:通过将扫数日历摘要运动起来计较ROUGE,以评估举座的一致性;(2)Agree F1:仅使用匹配日历的摘要计较ROUGE,以评估特定日历的准确性;(3)Align F1:在计较ROUGE之前,先左证相似性和日历接近性对预计摘要和参考摘要进行对皆,评估对皆后的一致性。

Date F1:猜度生成时期线中日历与参考时期线中真确日历匹配进度。

2. 洞开域TLS

在洞开域TLS的实验中,CHRONOS与几个基线智力进行了比较,包括径直搜索标的新闻(DIRECT)和重写标的新闻以创建查询用于检索(REWRITE)。

对比之下,CHRONOS通过迭代自我发问和检索有关新闻著述的智力,显耀提高了事件纪念的质料和日历对皆的准确性,在扫数主张上都跨越于基线智力。

3. 阻塞域TLS

在阻塞域TLS的实验中,CHRONOS与之前的代表性职责进行了比较,包括:(1)基于事件团员智力的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)专揽大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。

在Crisis和T17这两个经典数据集上的比较截至露馅,CHRONOS达到了与这些职责雷同的弘扬,在两个数据集的AR-2主张上赢得了SOTA成果,讲解了其在不同类型事件和时期跨度上的重大性能和适合性。

4. 运行时期分析

CHRONOS的另一个上风体当今效力方面。

与一样基于大模子、但需要处理新闻库中扫数著述的LLM-TLS智力比拟,它通过检索增强机制专注于最有关的新闻著述,显耀减少了处理时期。

这种效力的普及使其在推行应用中更为实用,尤其是在需要快速反映的场景中。

案例磋商:苹果产物发布时期线

团队长远分析了模子在处理具体新闻事件时的弘扬,通过遴荐具有代表性的新闻事件,如苹果公司的紧要产物发布,粗略不雅察到CHRONOS何如通过由表及里的自我发问和信息检索来生成时期线。

在案例磋商中,CHRONOS展示了其粗略准确提真金不怕火关节事件和日历的才能,同期也揭示了在某些情况下可能需要改革的处所,举例对某些事件的遗漏或日历幻觉。

结语

CHRONOS框架通过聚拢大型讲话模子的迭代自我发问和检索增强生成时候,为时期线纪念任务提供了一种新颖且有用的处置有野心。

这种智力的中枢在于模拟东谈主类的信息检索进程,通过不断地提议和回话新问题来冉冉长远合资事件,最毕生成一个全面且连贯的时期线摘要。

实验截至仍是充分讲解了CHRONOS在复杂事件检索和构建时期线方面的才能,展示了该框架在推行新闻时期线生成应用中的应用后劲和准确性。

同期,这种迭代发问的检索生成智力是否具有泛化到通用任务上的才能也值得将来进一步磋商。

Reference:

[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.

[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.

— 完 —加拿大pc28官网开奖网址

加拿大pc28开奖

加拿大pc28预测官网开奖

pc28