加拿大pc28在线预测

加拿大pc28走势预测结果组合预测 用大模子吃瓜更智能了!阿里通义实验室忽视新时辰线追忆框架,全面普及新闻追忆着力

         发布日期:2024-12-23 08:22    点击次数:185
通达域和禁闭域TLS都更高效了

目下加拿大pc28走势预测结果组合预测,大模子不错帮你梳理新闻时辰线了,以后吃瓜就更绵薄了!

AI Agent的风,我们赛博乐子东说念主也得吹吹。

这即是来自阿里巴巴通义实验室与上海交通大学的新商量,他们忽视了一种基于Agent的新闻时辰线纲目新框架——CHRONOS。

它不仅不错帮你从海量新闻中追忆出要紧事件,更要紧的是,它还不错梳理出明晰的时辰线,以后上网冲浪时各式复杂事件都一目了然。

其中的CHRONOS一词取自希腊传闻中的时辰之神柯罗诺斯。

该框架通过迭代多轮的自我发问神色,市欢检索增强生成时间,从互联网上检索联系事件信息,并生成时辰规定的新闻纲目,为新闻时辰线纲目生成提供了一种全新的料理决策。

先来沿途瞅瞅几个例子。

比如对于新闻“国足1-0巴林”,CHRONOS概况追忆海量新闻,呈现事件的一脉换取。

对于遮蔽时辰更长的新闻“中国探月工程”,CHRONOS也能聚焦重隐衷件,呈刻下辰线发展,使得用户概况一目了然。

补都通达域TLS短板

时辰线追忆(Timeline Summarization, TLS)任务是一种当然话语处理规模的经典时间挑战,它旨在从大都文本数据中提真金不怕火关键事件,并按时间规定陈设,以提供对某一主题或规模历史发展的结构化视图。

举例,在新闻规模,时辰线追忆不错匡助用户快速了解一个新闻事件的一脉换取。该任务不仅条目识别出要紧的事件,还需秩序略事件之间的时辰关系和因果酌量,以便生成一个连贯、圣洁且信息丰富的时辰线纲目。

阐发可检索事件的起原,不错将TLS任务细分为禁闭域(closed-domain)和通达域(open-domain)两个设定:在禁闭域TLS任务中,时辰线是从一组预界说的、与特定主题或规模联系的新闻著述中创建的,而通达域TLS指的是从互联网上径直搜索和检索新闻著述来生成时辰线的进程。

往常的职责东要齐集于料理禁闭域上时辰线生成问题,而通达域TLS则需要巨大的信息检索和筛选才能,以及在莫得全局视图的情况下识别和建设事件之间酌量的才能,为这项任务忽视了新的要乞降挑战。

迭代检索的CHRONOS框架

为了应付上述挑战,团队忽视CHRONOS框架,通过迭代发问进行联系事件检索,生成准确、全面的时辰线纲目,概况有用地料理通达域和禁闭域两种设定下的TLS任务。

1. 动机

时辰线生成的中枢在于建设事件之间的时辰和因果关系。

每个新闻事件都不错被默示为一个不同的节点,任务的标的是建设这些节点之间的边,以展示它们的联系性,并最终酿成一个异构图,从主题新闻的节点动手。

因此,通过一个检索机制来检索联系的新闻著述,不错有用建设这些边,酿成事件之间的酌量。

2. 概括

CHRONOS应用大模子的才能,通过模拟东说念主类信息检索的进程,即通过忽视问题、基于检索阻挡进一步忽视新的问题,最终收罗对于联系事件的全面信息并追忆为时辰线。

CHRONOS包括以下几个模块:

自我发问 (Self-Questioning):领先搜索粗粒度的新闻配景信息,然后迭代地忽视问题,以检索更多联系新闻。

问题改写 (Question Rewriting):将复杂或进展欠安的问题解析为更具体、更易检索的查询。

时辰线生成 (Timeline Generation):通过统一每一轮检索生成的时辰线来追忆一个杰出要紧事件的时辰线。

3. 自我发问3.1 粗粒度配景调研

在自我发问的驱动阶段,CHRONOS使用标的新闻的标题行动关键词进行搜索,以收罗与标的新闻最径直联系的信息。

这些信息组成了新闻配景(News Context),为自我发问打下初步基础。

3.2 发问示例选拔

在粗粒度配景调研之后,CHRONOS应用大模子的落魄体裁习才能,通过少许样本教唆来携带模子生成对于标的新闻的问题。

为了评估问题样履行量,引入了时序信息量(Chrono-Informativeness, CI)的见识,用来揣摸模子忽视的问题检索与参考时辰线对都事件的才能,即高CI值的问题更有可能指点检索到与标的新闻事件联系的著述,用检索生成的时辰线和参考时辰线中包含日历的F1分数进行揣摸。

基于最大化问题集时序信息量的标的,构建一个“新闻-问题”的示例池,用于携带新标的新闻的问题生成。

对于每个新的标的新闻,通过余弦相似性动态检索与标的新闻最相似的样本,确保了样本的落魄文联系性和时辰信息的准确性。

3.3 迭代发问

CHRONOS通过一语气迭代发问,冉冉深化探索事件的细节。

每一轮迭代都基于前一轮的检索阻挡,以发现新的问题和信息,直到傲气时辰线中事件数目或达到最大迭代次数。

3.4 问题改写

查询改写(Query Rewriting)是检索增强生成中常用的优化设施。

在CHRONOS框架中,团队通过对驱动发问阶段产生的广大或复杂问题改写为2-3个更易于检索的子问题,概况生成更具体、更有针对性的查询,从而提高搜索引擎的检索着力。

他们相似在教唆中加入少许样本,携带大模子进行有用改写,将复杂问题回荡为更具体的查询,同期保捏问题的原始意图。

3.5 时辰线生成

CHRONOS通过两阶段生成完满的时辰线追忆:生成(Generation)和统一(Merging)。

生成:通过分析每一轮检索到的新闻著述来识别关键事件和注视信息。应用大模子的解析和生成才能,提真金不怕火每个事件的发诞辰期和联系细节,并为每个事件撰写圣洁的面貌。这些事件和面貌被组织成初步的时辰线,按照时辰规定陈设,为后续的统一阶段提供基础。

统一:将多轮检索生成的初步时辰线整合成一个连贯的最终纲目。这一进程波及对都不同时间线中的事件、料理任何日历或面貌上的冲破,并选拔最具代表性和要紧性的事件。

全新数据集OPEN-TLS

为了评估TLS系统,商量团队还收罗了由专科记者撰写的对于近期新闻事件的时辰线,构建了一个名为Open-TLS的新数据集。

与以往禁闭域的数据集比较,Open-TLS不仅在数据集范畴和内容上愈加各样化,遮蔽政事、经济、社会、体育和科学时间等多个规模,况且在时效性上更具上风,为通达域TLS任务提供了一个更全面和更具挑战性的基准。

实验阻挡

1. 实验设定

实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B辞别构建CHRONOS系统,评测通达域和禁闭域两个设定下TLS的性能进展。使用的评估谋划主要有:

ROUGE-N: 揣摸生成时辰线和参考时辰线之间的N-gram肖似。具体包括:(1)Concat F1:通过将所有这个词日历纲目清楚起来规划ROUGE,以评估举座的一致性;(2)Agree F1:仅使用匹配日历的纲目规划ROUGE,以评估特定日历的准确性;(3)Align F1:在规划ROUGE之前,先阐发相似性和日历接近性对预计纲目和参考纲目进行对都,评估对都后的一致性。

Date F1:揣摸生成时辰线中日历与参考时辰线中确切日历匹配进程。

2. 通达域TLS

在通达域TLS的实验中,CHRONOS与几个基线设施进行了比较,包括径直搜索标的新闻(DIRECT)和重写标的新闻以创建查询用于检索(REWRITE)。

对比之下,CHRONOS通过迭代自我发问和检索联系新闻著述的设施,显贵提高了事件追忆的质地和日历对都的准确性,在所有这个词谋划上都高出于基线设施。

3. 禁闭域TLS

在禁闭域TLS的实验中,CHRONOS与之前的代表性职责进行了比较,包括:(1)基于事件团员设施的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)应用大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。

在Crisis和T17这两个经典数据集上的比较阻挡走漏,CHRONOS达到了与这些职责类似的进展,在两个数据集的AR-2谋划上得到了SOTA着力,评释了其在不同类型事件和时辰跨度上的巨大性能和符合性。

4. 运行时辰分析

CHRONOS的另一个上风体目下着力方面。

与相似基于大模子、但需要处理新闻库中所有这个词著述的LLM-TLS设施比较,它通过检索增强机制专注于最联系的新闻著述,显贵减少了处理时辰。

这种着力的普及使其在履行应用中更为实用,尤其是在需要快速反应的场景中。

案例商量:苹果产物发布时辰线

团队深化分析了模子在处理具体新闻事件时的进展,通过选拔具有代表性的新闻事件,如苹果公司的紧要产物发布,概况不雅察到CHRONOS如何通过按部就班的自我发问和信息检索来生成时辰线。

在案例商量中,CHRONOS展示了其概况准确提真金不怕火关键事件和日历的才能,同期也揭示了在某些情况下可能需要矫正的场所,举例对某些事件的遗漏或日历幻觉。

结语

CHRONOS框架通过市欢大型话语模子的迭代自我发问和检索增强生成时间,为时辰线追忆任务提供了一种新颖且有用的料理决策。

这种设施的中枢在于模拟东说念主类的信息检索进程,通过约束地忽视和回复新问题来冉冉深化解析事件,最终身成一个全面且连贯的时辰线纲目。

实验阻挡仍是充分评释了CHRONOS在复杂事件检索和构建时辰线方面的才能,展示了该框架在履行新闻时辰线生成应用中的应用后劲和准确性。

同期,这种迭代发问的检索生成设施是否具有泛化到通用任务上的才能也值得畴昔进一步商量。

Reference:

[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.

[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.

— 完 —加拿大pc28走势预测结果组合预测



 
友情链接:

Powered by pc28 @2013-2022 RSS地图 HTML地图