pc28

加拿大pc28预测结果走势分析
加拿大pc28官网登录 用大模子吃瓜更智能了!阿里通义实验室建议新时候线回来框架,全面升迁新闻回来着力
发布日期:2024-12-28 06:14    点击次数:101
怒放域和阻滞域TLS都更高效了

面前,大模子不错帮你梳理新闻时候线了,以后吃瓜就更浅易了!

AI Agent的风,我们赛博乐子东谈主也得吹吹。

这等于来自阿里巴巴通义实验室与上海交通大学的新探究,他们建议了一种基于Agent的新闻时候线选录新框架——CHRONOS。

它不仅不错帮你从海量新闻中回来出遑急事件,更遑急的是,它还不错梳理出明晰的时候线,以后上网冲浪时种种复杂事件都一目了然。

其中的CHRONOS一词取自希腊传说中的时候之神柯罗诺斯。

该框架通过迭代多轮的自我发问模样,纠合检索增强生成工夫,从互联网上检索关系事件信息,并生成时候轨则的新闻选录,为新闻时候线选录生成提供了一种全新的贬责决策。

先来一王人瞅瞅几个例子。

比如对于新闻“国足1-0巴林”,CHRONOS大致回来海量新闻,呈现事件的世代相承。

对于隐讳时候更长的新闻“中国探月工程”,CHRONOS也能聚焦要点事件,呈当前候线发展,使得用户大致一目了然。

补王人怒放域TLS短板

时候线回来(Timeline Summarization, TLS)任务是一种当然讲话处理界限的经典工夫挑战,它旨在从无数文本数据中索求要害事件,并依时间轨则罗列,以提供对某一主题或界限历史发展的结构化视图。

举例,在新闻界限,时候线回来不错匡助用户快速了解一个新闻事件的世代相承。该任务不仅条目识别出遑急的事件,还需措施路事件之间的时候关系和因果辩论,以便生成一个连贯、纵脱且信息丰富的时候线选录。

把柄可检索事件的开头,不错将TLS任务细分为阻滞域(closed-domain)和怒放域(open-domain)两个设定:在阻滞域TLS任务中,时候线是从一组预界说的、与特定主题或界限关系的新闻著作中创建的,而怒放域TLS指的是从互联网上径直搜索和检索新闻著作来生成时候线的历程。

当年的责任东要靠拢于贬责阻滞域上时候线生成问题,而怒放域TLS则需要高大的信息检索和筛选智力,以及在莫得全局视图的情况下识别和诞滋事件之间辩论的智力,为这项任务建议了新的要乞降挑战。

迭代检索的CHRONOS框架

为了应答上述挑战,团队建议CHRONOS框架,通过迭代发问进行关系事件检索,生成准确、全面的时候线选录,大致有用地贬责怒放域和阻滞域两种设定下的TLS任务。

1. 动机

时候线生成的中枢在于诞滋事件之间的时候和因果关系。

每个新闻事件都不错被示意为一个不同的节点,任务的地点是诞生这些节点之间的边,以展示它们的关系性,并最终酿成一个异构图,从主题新闻的节点入手。

因此,通过一个检索机制来检索关系的新闻著作,不错有用诞生这些边,酿成事件之间的辩论。

2. 空洞

CHRONOS行使大模子的智力,通过模拟东谈主类信息检索的历程,即通过建议问题、基于检索截止进一步建议新的问题,最终收罗对于关系事件的全面信息并回来为时候线。

CHRONOS包括以下几个模块:

自我发问 (Self-Questioning):最初搜索粗粒度的新闻配景信息,然后迭代地建议问题,以检索更多关系新闻。

问题改写 (Question Rewriting):将复杂或发达欠安的问题理解为更具体、更易检索的查询。

时候线生成 (Timeline Generation):通过并吞每一轮检索生成的时候线往返来一个杰出遑急事件的时候线。

3. 自我发问3.1 粗粒度配景调研

在自我发问的开动阶段,CHRONOS使用地点新闻的标题行为要害词进行搜索,以收罗与地点新闻最径直关系的信息。

这些信息组成了新闻配景(News Context),为自我发问打下初步基础。

3.2 发问示例选择

在粗粒度配景调研之后,CHRONOS行使大模子的落魄体裁习智力,通过小数样本教唆来携带模子生成对于地点新闻的问题。

为了评估问题样推行量,引入了时序信息量(Chrono-Informativeness, CI)的观念,用来预见模子建议的问题检索与参考时候线对王人事件的智力,即高CI值的问题更有可能指引检索到与地点新闻事件关系的著作,用检索生成的时候线和参考时候线中包含日历的F1分数进行预见。

基于最大化问题集时序信息量的地点,构建一个“新闻-问题”的示例池,用于携带新地点新闻的问题生成。

对于每个新的地点新闻,通过余弦相似性动态检索与地点新闻最相似的样本,确保了样本的落魄文关系性和时候信息的准确性。

3.3 迭代发问

CHRONOS通过连气儿迭代发问,逐渐久了探索事件的细节。

每一轮迭代都基于前一轮的检索截止,以发现新的问题和信息,直到得志时候线中事件数目或达到最大迭代次数。

3.4 问题改写

查询改写(Query Rewriting)是检索增强生成中常用的优化要津。

在CHRONOS框架中,团队通过对开动发问阶段产生的精深或复杂问题改写为2-3个更易于检索的子问题,大致生成更具体、更有针对性的查询,从而提高搜索引擎的检索成果。

他们雷同在教唆中加入小数样本,携带大模子进行有用改写,将复杂问题升沉为更具体的查询,同期保握问题的原始意图。

如今,鲁能一线队从青年队选拔球员,已经有一套成熟的流程。青年队球员首先要能在鲁能二队踢中乙时,有明显高人一筹的表现,才能有机会来一线队接受考察的机会。这一点,可以体现在梅帅军、陈泽仕、依木兰这些二队核心球员上。这三位球员在青年队比赛中,属于无敌的存在。

3.5 时候线生成

CHRONOS通过两阶段生成圆善的时候线回来:生成(Generation)和并吞(Merging)。

生成:通过分析每一轮检索到的新闻著作来识别要害事件和提神信息。行使大模子的知道和生成智力,索求每个事件的发生辰期和关系细节,并为每个事件撰写纵脱的描写。这些事件和描写被组织成初步的时候线,按照时候轨则罗列,为后续的并吞阶段提供基础。

并吞:将多轮检索生成的初步时候线整合成一个连贯的最终选录。这一历程触及对王人不同时间线中的事件、贬株连何日历或描写上的打破,并选择最具代表性和遑急性的事件。

全新数据集OPEN-TLS

为了评估TLS系统,探究团队还收罗了由专科记者撰写的对于近期新闻事件的时候线,构建了一个名为Open-TLS的新数据集。

与以往阻滞域的数据集比较,Open-TLS不仅在数据集限制和内容上愈加种种化,隐讳政事、经济、社会、体育和科学工夫等多个界限,况且在时效性上更具上风,为怒放域TLS任务提供了一个更全面和更具挑战性的基准。

实验截止

1. 实验设定

实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B鉴识构建CHRONOS系统,评测怒放域和阻滞域两个设定下TLS的性能发达。使用的评估主义主要有:

ROUGE-N: 预见生成时候线和参考时候线之间的N-gram重复。具体包括:(1)Concat F1:通过将统统日历选录相接起来筹谋ROUGE,以评估合座的一致性;(2)Agree F1:仅使用匹配日历的选录筹谋ROUGE,以评估特定日历的准确性;(3)Align F1:在筹谋ROUGE之前,先把柄相似性和日历接近性对瞻望选录和参考选录进行对王人,评估对王人后的一致性。

Date F1:预见生成时候线中日历与参考时候线中实在日历匹配进程。

2. 怒放域TLS

在怒放域TLS的实验中,CHRONOS与几个基线要津进行了比较,包括径直搜索地点新闻(DIRECT)和重写地点新闻以创建查询用于检索(REWRITE)。

对比之下,CHRONOS通过迭代自我发问和检索关系新闻著作的要津,显耀提高了事件回来的质地和日历对王人的准确性,在统统主义上都卓绝于基线要津。

3. 阻滞域TLS

在阻滞域TLS的实验中,CHRONOS与之前的代表性责任进行了比较,包括:(1)基于事件团员要津的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)行使大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。

在Crisis和T17这两个经典数据集上的比较截止暴露,CHRONOS达到了与这些责任雷同的发达,在两个数据集的AR-2主义上赢得了SOTA成果,解说了其在不同类型事件和时候跨度上的高大性能和得当性。

4. 运行时候分析

CHRONOS的另一个上风体面前着力方面。

与雷同基于大模子、但需要处理新闻库中统统著作的LLM-TLS要津比较,它通过检索增强机制专注于最关系的新闻著作,显耀减少了处理时候。

这种着力的升迁使其在推行应用中更为实用,尤其是在需要快速反应的场景中。

案例探究:苹果居品发布时候线

团队久了分析了模子在处理具体新闻事件时的发达,通过选择具有代表性的新闻事件,如苹果公司的紧要居品发布,大致不雅察到CHRONOS何如通过行远自迩的自我发问和信息检索来生成时候线。

在案例探究中,CHRONOS展示了其大致准确索求要害事件和日历的智力,同期也揭示了在某些情况下可能需要校正的地方,举例对某些事件的遗漏或日历幻觉。

结语

CHRONOS框架通过纠合大型讲话模子的迭代自我发问和检索增强生成工夫,为时候线回来任务提供了一种新颖且有用的贬责决策。

这种要津的中枢在于模拟东谈主类的信息检索历程,通过不断地建议和回复新问题来逐渐久了知道事件,最毕生成一个全面且连贯的时候线选录。

实验截止照旧充理解说了CHRONOS在复杂事件检索和构建时候线方面的智力,展示了该框架在推行新闻时候线生成应用中的应用后劲和准确性。

同期,这种迭代发问的检索生成要津是否具有泛化到通用任务上的智力也值得畴昔进一步探究。

Reference:

[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.

[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.

— 完 —加拿大pc28官网登录