计算机⼆级(Python)__第三⽅库
Python第三⽅库依照安装⽅式灵活性和难易程度有3个⽅法,建议⼀次使⽤,这三个⽅法是:pip⼯具安装、⾃定义安装和⽂件安装。
pip⼯具安装:
最常⽤且最⾼效的Python第三⽅库安装⽅式采⽤pip⼯具安装。pip是Python官⽅提供并维护的在线第三⽅库安装⼯具。对于Python3.x版本环境,可以采⽤pip3命令代替pip命令专为Python3.x版本安装第三⽅库。
使⽤pip安装第三⽅库需要联⽹。安装⼀个库的命令如下:
pip install <;拟安装库名>
例如,安装pygame库,pip⼯具默认从⽹络上下载pygame库安装⽂件并⾃动安装到系统中
pip是Python第三⽅库最主要的安装⽅式,可以安装超过95%以上的第三⽅库。然⽽,由于⼀些历史、技术和政策等原因,还有⼀些第三⽅库暂时⽆法⽤pip安装,此时,需要其他的安装⽅法。
pip⼯具与操作系统也有关系,在MacOS X和Linux等操作系统中,pip⼯具⼏乎可以安装⼈格Python第三⽅库;在Windows操作系统中,有⼀些第三⽅库仍然需要⽤其他⽅式尝试安装。
⾃定义安装:
⾃定义安装指按照第三⽅库提供的步骤和⽅式安装。第三库都有主页⽤于维护库的代码和⽂档。以科学计算⽤的numpy为例,开发者维护的官⽅主页是:
浏览该⽹页到下载连接,如下:
进⽽根据指⽰步骤安装。
⾃定义安装⼀般适⽤于在pip中尚⽆登记货安装失败的第三⽅库。
⽂件安装:
由于Python某些第三⽅库仅提供源代码,通过pip下载⽂件后⽆法在Windows系统编译咱装,会导致第三⽅库安装失败。在Windows平台下所遇到⽆法安装第三⽅库的问题⼤多属于这类。
为了解决这类第三⽅库安装问题,美国加州⼤学尔湾分校提供了⼀个页⾯,帮助Python⽤户获得Windows可直接安装的第三⽅库,链接地址如下:
该地址列出了⼀批在pip安装中可能出现问题的第三⽅库。这⾥以scipy为例说明,⾸先在上述页⾯中到scipy库对应的内容。选择其中的.whl⽂件下载,这⾥选择适⽤于Python 3.5版本解释器和32为系统的对应⽂件:scipy-0.17.1-cp35m-win32.whl,下载⽂件到⽬录D:\pycodes⽬录。然后采⽤pip命令安装该⽂件。命令为:
pip install D:\pycodes\ scipy-0.17.1-cp35m-win32.whl
对于上述3种安装⽅式,⼀般优先采⽤pip⼯具安装,如果安装失败,则选择⾃定义安装或者⽂件安装。另外,如果需要在没有⽹络条件下安装Python第三⽅库,请直接采⽤⽂件安装⽅式。其中,.whl⽂件可以通过pip download指令在有⽹络条件的情况下获得。
下⾯介绍三个重要的第三⽅库
PyInstaller库
PyInstaller是⼀个⼗分有⽤的Python第三⽅库,它能在Windows、Linux、MacOS X等操作系统下将Python源⽂件(.py)打包,变成直接可运⾏的可执⾏⽂件。注意,PyInstaller针对不同操作系统打包⽣成的可执⾏⽂件都不同。
通过队员⽂件打包,Python程序可以在没有安装Python的环境中运⾏,也可以作为⼀个独⽴⽂件⽅便
传递和管理。PyInstaller需要在命令⾏下⽤pip⼯具安装,安装如下:
pip install PyInstaller
使⽤PyInstaller库对Python源⽂件打包⼗分简单,使⽤⽅法如下:
pyinstaller <Python源程序⽂件名>
执⾏完毕后,源⽂件所在⽬录将⽣成dist和build两个⽂件夹。其中,build⽬录是PyInstaller储存临时⽂件的⽬录,可以安全删除。最终的打包程序在dist内部与源⽂件同名的⽬录中。⽬录种其他⽂件是可执⾏⽂件的动态链接库。
注意⽂件路径 种不能出现空格和英⽂句号(.),源⽂件必须是UTF-8编码,暂不⽀持其他编码类型。采⽤IDLE编写的源⽂件都保存为UTF-8编码形式,可直接使⽤。
pyinstaller命令的常⽤参数如下表所⽰:
参数功能
-h,-help查看帮助
-
-clean清理打包过程中的临时⽂件
-D,--onedir默认值,⽣成dist⽬录
-F,--onefile在dist⽂件夹中只⽣成独⽴的打包⽂件
-I <;图标⽂件名.ico>指定打包程序使⽤的图标(icon)⽂件
命令不需要在Python源⽂件中增加代码,只需要命令⾏中进⾏打包即可
例如命名:
pyinstaller -i snowflake.ico -F SnowView.py
该命令将指定snowflake.ico⽂件为图标打包程序SnowView
jieba库
由于中⽂⽂本中的单词不是通过空格或者标点符号分隔,中⽂及类似语⾔存在⼀个重要的分词问题。
jieba(“结巴”)是Python中⼀个重要的第三⽅中⽂分词函数库,能够将⼀段中⽂⽂本分割成中⽂词语的序列。jieba库需要通过pip指令安装,命令如下:
pip install jieba
jieba库的分词原理是利⽤⼀个中⽂词库,将待分词的内容与分词库进⾏对⽐,通过图结构和动态规划⽅法到最⼤概率的词组。除了分词,jieba还提供增加⾃定义中⽂单词的功能。
jieba库⽀持三种分词模式:精确模式,将句⼦最精确的切开,适合⽂本分析;全模式,把句⼦中所有可以分词的词语都扫描出来,速度⾮常快,但是不能解决歧义;搜索引擎模式,在精确模式基础上,对长词再次切分,提⾼召回率,适合⽤于搜索引擎分词。
python官方文档中文版
jiaba库包含的主要函数如下表:
函数描述
jieba.lcut(s)精确模式,但会⼀个列表类型
jieba.lcut(s,cut_all = ture)全模式,返回⼀个列表类型
jieba.lcut_for_search(s)搜索模式,返回⼀个列表类型
jieba.add_word(w)向分词词典中增加新词w
worldcloud库
数据展⽰的⽅式多种多样,传统的统计图尽管很科学,但略显古板,尤其对于⽂本来说更加直观、带有⼀定艺术感的展⽰效果需求恨到。对于这类需求,词云特有的展⽰⽅式深得⼈⼼。
词云以词语为基本单元,根据其在⽂本中出现的频率设计不同⼤⼩以形成视觉上的不同效果,形成“关键词云层”或“关键词渲染”,从⽽使读者只要⼀眼就能领略⽂本的主旨。
worldcloud库是专门⽤于根据⽂本⽣成词云的Python第三⽅库,试分常⽤有趣。
下图以《红楼梦》⼈物出场词云统计为例,展⽰词云效果:
由于worldcloud库在2020年计算机⼆级中的要求是可选,所以并不做过多的介绍,有兴趣的⼈可以⾃⼰多了解哦!
对于更⼴泛的Python计算机⽣态,只要求了解第三⽅库的名称,不限于以下领域:⽹络爬⾍、数据分析、⽂本处理、出具可视化、⽤户图形界⾯、机器学习、Web开发、游戏开发等。