|
9版本最新更新1. 完整的 Unicode 支持我们总是尝试选择与语言无关的文本分析技术。这使用户能够分析超过 50 种语言的文本数据。但是,要分析默认 Windows 安装不支持的语言,用户需要更改一些 Windows 设置。虽然可以分析多种语言的数据集,但某些语言组合根本不可能。新的 Unicode 版本的 WordStat 允许您在不更改任何设置的情况下分析其中的任何一种,以及以前不支持的新语言,例如中文、日文或泰文。还添加了前三种亚洲语言的分词例程。
2. R 和 Python 预处理和后处理脚本的集成2018 年,我们向 WordStat 8 引入了创建 Python 预处理脚本的可能性。9.0 版通过提供在 R 中创建预处理脚本的可能性来扩展此功能。更重要的是,现在可以用这两种编程语言创建后处理脚本,允许对原始或转换后的文本数据或通过对这些文档的内容分析获得的量化结果执行自定义分析。这样的功能为扩展 WordStat 的功能提供了无限的可能性,例如实现新的机器学习算法、高级统计建模技术或自定义数据转换。已包含示例脚本以计算文本可读性指标、检测语言 3. 自动拼写更正从头开始编写了一个新的拼写检查引擎,以实现更快、更准确的拼写更正,允许实施自动拼写更正功能,同时对 WordStat 现有文本处理速度的影响最小。智能拼写更正甚至可以更正技术词汇、专有名词等未知术语的拼写,结果可以自动保存到替换列表中进行修改和更正。 4. 带有图表面板和过滤的交叉制表交叉表页面现在包括一个图表面板,允许用户快速绘制交叉表中选定行的分布,以获取当前选定变量或任何其他变量的值。过滤列表框还允许人们分析所选变量的单个值或一组值的此类分布。 5.交互式共现矩阵共现页面添加了一个新的交互式矩阵功能,允许人们专注于特定的共现。主要结果由一个表格组成,该表格显示了从各种共现统计中进行的选择。这种矩阵也是高度交互的,允许使用简单的拖放操作将特定行转换为新列,反之亦然。左侧的图表面板还允许人们评估特定共现在其他变量中的分布。人们还可以获得与特定共现相关联的所有文本段的快速视图。WordStat 的这一新功能也可以通过选择应显示为列的目标项目(单词或内容类别)、右键单击并选择 Co-Occurrence Matrix 从频率列表中调用。
6. Nexis UNI 和 Factiva 文件的导入在 2020 年的 QDA Miner 6.0 中引入,现在 WordStat 也可以从 LexisNexis 和 Factiva 输出文件中导入新闻记录。在选择从这些服务中获得的一个或多个 .DOCX 或 RTF 文件后,WordStat 将提取并在单独的变量中存储新闻记录的标题和正文、其来源、出版日期和其他相关信息。这样的功能应该证明对声誉管理、品牌管理、危机传播、媒体框架分析、比较媒体研究等有用。 7. 主题模型的批处理使用主题建模技术选择要提取的主题数量仍然是一个问题,据我们所知,没有明确的答案。我们甚至会怀疑是否存在这样一个最优数字。事实上,人们甚至可能认为使用不同设置获得的信息很可能服务于不同的目的或揭示现实的不同方面。在这种不确定性的背景下,研究人员经常想要比较各种解决方案。新的批处理功能允许通过系统地改变要提取的主题数量来计算多个主题模型,并且对于概率方法(例如 NNMF),可以使用相同的设置执行多次运行以评估结果的稳定性。 8. 在关键字检索和 KWIC 结果上创建词云现在可以直接在关键字检索和上下文关键字 (KWIC) 结果上获得交互式词云和词频表,从而可以快速识别与特定内容类别相关联的词,或者在特定目标项目之前、之后出现的词。
9. 更强大的邻近规则邻近规则中的条件数量已从四个增加到最多二十个条件。如果您认为这还不够,请告诉我们。 10. 通配符和字典交互的预览效果在字典中使用通配符非常强大,但可能会很麻烦,因为它可以匹配您可能没有想到的项目。例如,像 TAX* 这样的条目可能允许您匹配 TAX、TAXES、TAXATION,但也会匹配诸如 TAXI、TAXONOMY、TAXIDERMY 等词。此外,用于匹配项目和防止重复计算的 WordStat 规则也可能会产生意外由您的分类模型中的其他条目引起的结果。排除和分类页面右侧的新面板使您可以轻松识别在单词末尾使用 * 通配符匹配的新条目,但也可以识别与字典中其他条目可能发生冲突的新条目。
11.项目文件的密码保护WordStat 9.0 现在提供密码保护项目文件的可能性,将特定项目的访问权限限制为授权用户。一个对话框允许项目管理员创建新的用户帐户并指定每个用户可以执行的操作。人们可能会限制数据编辑、数据导入或转换,以及项目数据、表格和图形的导出。或者,您可以选择让用户执行他们想要的任何转换,但阻止他们保存项目文件。
12.清理数据的新选项预处理页面现在包括自动删除文本消息中的 URL 以及新闻和采访记录中的发言人指定的选项。 13. 新的堆积面积图交叉表页面的图表功能增加了创建两种类型的堆积面积图的可能性。
14. 对应图中的彩色项目颜色渐变现在可用于表示特定项目或变量类在第三(深度)维度或 2D 和 3D 对应图上的位置。最多可以选择四种颜色来创建这些渐变。
15.改进的气泡图现在可以转置气泡图的行和列。 16.链接分析缓冲区链接分析缓冲区允许人们回到以前的链接图,然后前进。 17. 更快更准确的主题丰富WordStat 超越了典型的主题建模,提供了一个独特的主题丰富功能,可以识别相关的短语、潜在的异常和拼写错误。它还会自动生成相关的主题名称。在第 9 版中,此主题丰富功能现在比以前快一倍,并且执行更好的词义消歧,以获得更准确的例外列表。它还为拼写更正提供了更好的建议。 18.提高现有拼写纠正的速度和准确性现有的拼写更正功能现在速度提高了 30 倍,只需一两秒钟即可为数万个未知单词提供拼写更正建议。 19. 新的 .PPRJ 文件格式创建了具有新文件扩展名 (.pprj) 的新文件格式,从而改进了对 Unicode 数据的支持。但是,WordStat 9 保留了与我们所有软件先前版本的向后兼容性,并且可以打开和分析由 QDA Miner、SimStat 或更旧版本的 WordStat 创建的当前项目文件 (.ppj)。 20. 许多额外的改进对现有对话框、图形、数据管理和数据分析功能进行了一些附加选项和界面改进。
|
|
|
站点地图|隐私政策|加入我们 |
Copyright © 2022 上海卡贝信息技术有限公司 All rights reserved. |