发布日期:2024-12-30 05:32 点击次数:123
当今,大模子不错帮你梳理新闻时刻线了加拿大pc28在线预测手机,以后吃瓜就更便捷了!
AI Agent的风,我们赛博乐子东说念主也得吹吹。
这即是来自阿里巴巴通义实验室与上海交通大学的新研讨,他们提倡了一种基于Agent的新闻时刻线选录新框架——CHRONOS。
它不仅不错帮你从海量新闻中转头出进军事件,更进军的是,它还不错梳理出了了的时刻线,以后上网冲浪时各种复杂事件都一目了然。
其中的CHRONOS一词取自希腊别传中的时刻之神柯罗诺斯。
该框架通过迭代多轮的自我发问形势,结合检索增强生成本领,从互联网上检索推敲事件信息,并生成时刻规矩的新闻选录,为新闻时刻线选录生成提供了一种全新的处置决议。
先来全部瞅瞅几个例子。
比如对于新闻“国足1-0巴林”,CHRONOS大概转头海量新闻,呈现事件的一脉相承。
对于掩饰时刻更长的新闻“中国探月工程”,CHRONOS也能聚焦重隐衷件,呈当前刻线发展,使得用户大概一目了然。
补王人洞开域TLS短板
时刻线转头(Timeline Summarization, TLS)任务是一种当然讲话处理范围的经典本领挑战,它旨在从大批文本数据中索求要道事件,并按时期规矩陈列,以提供对某一主题或范围历史发展的结构化视图。
举例,在新闻范围,时刻线转头不错匡助用户快速了解一个新闻事件的一脉相承。该任务不仅条目识别出进军的事件,还需要聚积事件之间的时刻联系和因果推敲,以便生成一个连贯、简略且信息丰富的时刻线选录。
阐述可检索事件的着手,不错将TLS任务细分为禁闭域(closed-domain)和洞开域(open-domain)两个设定:在禁闭域TLS任务中,时刻线是从一组预界说的、与特定主题或范围推敲的新闻著作中创建的,而洞开域TLS指的是从互联网上告成搜索和检索新闻著作来生成时刻线的进程。
畴昔的责任东要荟萃于处置禁闭域上时刻线生成问题,而洞开域TLS则需要遍及的信息检索和筛选才智,以及在莫得全局视图的情况下识别和建造事件之间推敲的才智,为这项任务提倡了新的要乞降挑战。
迭代检索的CHRONOS框架
为了应答上述挑战,团队提倡CHRONOS框架,通过迭代发问进行推敲事件检索,生成准确、全面的时刻线选录,大概灵验地处置洞开域和禁闭域两种设定下的TLS任务。
1. 动机
时刻线生成的中枢在于建造事件之间的时刻和因果联系。
每个新闻事件都不错被示意为一个不同的节点,任务的标的是建造这些节点之间的边,以展示它们的推敲性,并最终酿成一个异构图,从主题新闻的节点出手。
因此,通过一个检索机制来检索推敲的新闻著作,不错灵验建造这些边,酿成事件之间的推敲。
2. 详细
CHRONOS哄骗大模子的才智,通过模拟东说念主类信息检索的进程,即通过提倡问题、基于检索放置进一步提倡新的问题,最终收罗对于推敲事件的全面信息并转头为时刻线。
CHRONOS包括以下几个模块:
自我发问 (Self-Questioning):最初搜索粗粒度的新闻布景信息加拿大pc28在线预测手机,然后迭代地提倡问题,以检索更多推敲新闻。
问题改写 (Question Rewriting):将复杂或进展欠安的问题解析为更具体、更易检索的查询。
时刻线生成 (Timeline Generation):通过归并每一轮检索生成的时刻线来转头一个隆起进军事件的时刻线。
3. 自我发问3.1 粗粒度布景调研
在自我发问的运转阶段,CHRONOS使用标的新闻的标题行为要道词进行搜索,以收罗与标的新闻最告成推敲的信息。
这些信息组成了新闻布景(News Context),为自我发问打下初步基础。
3.2 发问示例礼聘
在粗粒度布景调研之后,CHRONOS哄骗大模子的高下文体习才智,通过一丝样本领导来率领模子生成对于标的新闻的问题。
为了评估问题样实质料,引入了时序信息量(Chrono-Informativeness, CI)的意见,用来揣度模子提倡的问题检索与参考时刻线对王人事件的才智,即高CI值的问题更有可能指引检索到与标的新闻事件推敲的著作,用检索生成的时刻线和参考时刻线中包含日历的F1分数进行揣度。
基于最大化问题集时序信息量的标的,构建一个“新闻-问题”的示例池,用于率领新标的新闻的问题生成。
对于每个新的标的新闻,通过余弦相似性动态检索与标的新闻最相似的样本,确保了样本的高下文推敲性和时刻信息的准确性。
3.3 迭代发问
CHRONOS通过连气儿迭代发问,逐步深切探索事件的细节。
每一轮迭代都基于前一轮的检索放置,以发现新的问题和信息,直到骄气时刻线中事件数目或达到最大迭代次数。
3.4 问题改写
查询改写(Query Rewriting)是检索增强生成中常用的优化法式。
在CHRONOS框架中,团队通过对运转发问阶段产生的浅近或复杂问题改写为2-3个更易于检索的子问题,大概生成更具体、更有针对性的查询,从而提高搜索引擎的检索成果。
他们一样在领导中加入一丝样本,率领大模子进行灵验改写,将复杂问题飘摇为更具体的查询,同期保执问题的原始意图。
3.5 时刻线生成
CHRONOS通过两阶段生成齐备的时刻线转头:生成(Generation)和归并(Merging)。
生成:通过分析每一轮检索到的新闻著作来识别要道事件和隆重信息。哄骗大模子的聚积和生成才智,索求每个事件的发诞辰期和推敲细节,并为每个事件撰写简略的形色。这些事件和形色被组织成初步的时刻线,按照时刻规矩陈列,为后续的归并阶段提供基础。
归并:将多轮检索生成的初步时刻线整合成一个连贯的最终选录。这一进程触及对王人不同时期线中的事件、处置任何日历或形色上的阻碍,并礼聘最具代表性和进军性的事件。
全新数据集OPEN-TLS
为了评估TLS系统,研讨团队还收罗了由专科记者撰写的对于近期新闻事件的时刻线,构建了一个名为Open-TLS的新数据集。
与以往禁闭域的数据集比较,Open-TLS不仅在数据集范围和内容上愈加各种化,掩饰政事、经济、社会、体育和科学本领等多个范围,何况在时效性上更具上风,为洞开域TLS任务提供了一个更全面和更具挑战性的基准。
实验放置
1. 实验设定
实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B别离构建CHRONOS系统,评测洞开域和禁闭域两个设定下TLS的性能进展。使用的评估主张主要有:
ROUGE-N: 揣度生成时刻线和参考时刻线之间的N-gram访佛。具体包括:(1)Concat F1:通过将通盘日历选录伙同起来筹谋ROUGE,以评估举座的一致性;(2)Agree F1:仅使用匹配日历的选录筹谋ROUGE,以评估特定日历的准确性;(3)Align F1:在筹谋ROUGE之前,先阐述相似性和日历接近性对瞻望选录和参考选录进行对王人,评估对王人后的一致性。
Date F1:揣度生成时刻线中日历与参考时刻线中真确日历匹配进程。
2. 洞开域TLS
在洞开域TLS的实验中,CHRONOS与几个基线法式进行了比较,包括告成搜索标的新闻(DIRECT)和重写标的新闻以创建查询用于检索(REWRITE)。
对比之下,CHRONOS通过迭代自我发问和检索推敲新闻著作的法式,权贵提高了事件转头的质料和日历对王人的准确性,在通盘主张上都卓绝于基线法式。
3. 禁闭域TLS
在禁闭域TLS的实验中,CHRONOS与之前的代表性责任进行了比较,包括:(1)基于事件团聚法式的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)哄骗大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。
按照王宝泉的说法,在当时输给山东女排以后,64岁的他有些崩溃,而且这也导致他晚上严重失眠,在双重压力下,王宝泉主动强烈向组织提出了退出的申请,希望能够和陈方互换,结果就成了我们现在所看到的这样,天津女排一波连胜,最主要是天津女排的精气神回来了。王宝泉教练对于陈方教练也是高度评价,他认为陈方既年轻又富有激情,加入球队已经有两年多的时间,从助理教练做起,对于球队也非常的熟悉,看得出来王宝泉教练还是非常的大气。
尼克斯方面,今年绝对算是豪掷千金了。上赛季打进了半决赛,球队老大布伦森也是表现出色。所以球队抓住了这个夺冠窗口期。首先是交易得到OG阿奴诺比,随后又交易得到布里奇斯,紧接着又交易来了唐斯,组成了非常豪华的阵容。
在Crisis和T17这两个经典数据集上的比较放置显现,CHRONOS达到了与这些责任类似的进展,在两个数据集的AR-2主张上获得了SOTA成果,讲解了其在不同类型事件和时刻跨度上的遍及性能和符合性。
4. 运行时刻分析
CHRONOS的另一个上风体当今效劳方面。
与一样基于大模子、但需要处理新闻库中通盘著作的LLM-TLS法式比较,它通过检索增强机制专注于最推敲的新闻著作,权贵减少了处理时刻。
这种效劳的提高使其在试验应用中更为实用,尤其是在需要快速反应的场景中。
案例研讨:苹果居品发布时刻线
团队深切分析了模子在处理具体新闻事件时的进展,通过礼聘具有代表性的新闻事件,如苹果公司的首要居品发布,大概不雅察到CHRONOS何如通过按部就班的自我发问和信息检索来生成时刻线。
在案例研讨中,CHRONOS展示了其大概准确索求要道事件和日历的才智,同期也揭示了在某些情况下可能需要矫正的场所,举例对某些事件的遗漏或日历幻觉。
结语
CHRONOS框架通过结合大型讲话模子的迭代自我发问和检索增强生成本领,为时刻线转头任务提供了一种新颖且灵验的处置决议。
这种法式的中枢在于模拟东说念主类的信息检索进程,通过不断地提倡和回话新问题来逐步深切聚积事件,最终身成一个全面且连贯的时刻线选录。
实验放置也曾充分讲解了CHRONOS在复杂事件检索和构建时刻线方面的才智,展示了该框架在试验新闻时刻线生成应用中的应用后劲和准确性。
同期,这种迭代发问的检索生成法式是否具有泛化到通用任务上的才智也值得改日进一步研讨。
Reference:
[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.
[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.
[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.
— 完 —加拿大pc28在线预测手机