Code Monkey home page Code Monkey logo

textrank's Introduction

textrank

基于TextRank算法实现中文文本的关键词提取和摘要任务,核心计算代码保持与论文一致。

原理

TextRank的论文:

Mihalcea R, Tarau P. TextRank: Bringing order into texts[C]. Association for Computational Linguistics, 2004.


依赖

+jieba >= 0.35 +numpy >= 1.7.1


示例

from TextRank import textRank

text = """欧亚经济委员会执委会一体化与宏观经济委员格拉济耶夫日前接受新华社记者采访时高度评价**抗击新冠疫情工作,\
并表示期待欧亚经济联盟与**加强抗疫合作,共同推动地区发展。格拉济耶夫说,**依靠治理体系与全国人民协同努力,\
在抗疫工作上取得极大成效。**采取的措施符合全球利益。格拉济耶夫认为,**经济将会快速恢复,欧亚经济联盟许多企业与**市场联系紧密,\
应与**加强合作,采取协调措施降低此次疫情带来的消极影响。格拉济耶夫建议,面对疫情,欧亚经济联盟与**扩大信息技术应用,\
推进商品清关程序自动化,更广泛地利用相关机制,为对外经济活动参与者建立绿色通道。谈及双方在医学卫生领域的合作时,\
格拉济耶夫说:“我们应从当前考验中汲取经验,在生物安全领域制定共同规划并联合开展生物工程研究。”格拉济耶夫还表示,\
俄罗斯与其他欧亚经济联盟国家金融市场更易受国际投机行为影响。欧亚经济联盟应借鉴**的人民币国际化经验,加强与**银行体系和金融市场对接。\
欧亚经济联盟成立于2015年,成员国包括俄罗斯、哈萨克斯坦、白俄罗斯、吉尔吉斯斯坦和亚美尼亚。欧亚经济委员会执委会是欧亚经济联盟最高权力机构。"""

T = textRank.TextRank(text,pr_config={'alpha': 0.85, 'max_iter': 100})

# 提取前10个关键词
T.get_n_keywords(10)

# 提取前3个句子作为摘要

输出

# 关键词
[('**', 0.0409732016371885),
 ('欧亚', 0.020288574056379977),
 ('联盟', 0.020095514492593516),
 ('疫情', 0.01896670992106251),
 ('合作', 0.01762300199967477),
 ('经济', 0.017491198051334592),
 ('加强', 0.014129557788440673),
 ('金融市场', 0.013893142456055885),
 ('体系', 0.012966637917644607),
 ('俄罗斯', 0.012933808546504099)]
 
 # 句子
 
 [('欧亚经济委员会执委会一体化与宏观经济委员格拉济耶夫日前接受新华社记者采访时高度评价**抗击新冠疫情工作,并表示期待欧亚经济联盟与**加强抗疫合作,共同推动地区发展',
  0.14281076822079067),
 ('格拉济耶夫认为,**经济将会快速恢复,欧亚经济联盟许多企业与**市场联系紧密,应与**加强合作,采取协调措施降低此次疫情带来的消极影响',
  0.12857514563980263),
 ('欧亚经济联盟应借鉴**的人民币国际化经验,加强与**银行体系和金融市场对接', 0.11960701215088403)]

textrank's People

Contributors

abner-wong avatar yyt1105 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.