dora storm 文本_阿里文本反垃圾服务|电子爱好者

admin管理员组
文章数量:1574574

文本反垃圾服务能够有效帮助您检测出您的文本中是否存在违规的风险内容，本文指导您如何接入文本反垃圾服务。

本服务由阿里云计算有限公司(以下简称阿里云)提供。启用服务后，您存储在七牛云空间的文件将在您主动请求的情况下被提供给阿里云以供其计算使用。七牛不能保证鉴别结果的正确性，请您自行评估后选择是否启用。服务价格请您参考具体的服务价格，您使用本服务产生的费用由七牛代收。启用服务则表示您知晓并同意以上内容。

注意

服务地域：华东、华北、华南。

单条检测文本的长度不超过10000个字符。

一次请求最多不超过50条文本。

待检测的文本内容的编码格式支持：UTF-8、GBK、GB2312、GB18030、Big5(繁体中文)等常用编码类型。

资源的 Mime 文件格式仅支持文本类型：text/*，如：text/plain、text/html。

请求接口的并发(qps)不超过100。

请求接口为标准的HTTP/HTTPS 协议。

如何开启

进入七牛开发者平台的第三方数据处理，找到阿里文本反垃圾点击并开始使用。

快速使用

第一步

获取到您存在bucket里面的文本的 url，例如：https://dora-doc.qiniu/con1.txt

第二步

在您的文本的url后加上 ali_textscan，例如：https://dora-doc.qiniu/con1.txt?ali_textscan

请求语法

GET ?ali_textscan/biztype/

Host:

请求参数

字段

类型

是否必选

说明

scanRquestUrl

string

用于线上文档的请求会在请求成功之后对文档进行处理

bizType

string

特殊配置业务场景, 如有需要请通过工单联系技术支持

响应语法

HTTP/1.1 200 OK

X-Reqid:

Date:

Content-Length:

Content-Type: text/plain; charset=utf-8

{

// respDate

}

示例

在Web浏览器中输入以下视频地址：

https://dora-doc.qiniu/con1.txt?ali_textscan

返回结果

HTTP/1.1 200 OK

X-Reqid: _YEBAICNYlSPpbQV

Date: Thu, 25 Jul 2019 12:16:45 GMT

Content-Length: 266

Content-Type: text/plain; charset=utf-8

{

"code": 200,

"data": [

{

"code": 200,

"content": "七牛云存储\n",

"msg": "OK",

"results": [

{

"label": "normal",

"rate": 99.91,

"scene": "antispam",

"suggestion": "pass"

}

"taskId": "txt4CP9r0g5XdV74qlfLV6gNO-1r7hCy"

}

"msg": "OK",

"requestId": "D10CC413-03E1-44E1-B1C9-D1CC49D8FD78"

}

公共头响应头参数说明

字段

类型

是否必选

说明

code

整型

错误码，和HTTP状态码一致(但有扩展)。

• 2xx 表示成功。

• 4xx 表示请求有误。

• 5xx 表示后端有误。

具体参照公共错误码说明

msg

字符串

错误的进一步描述。

requestId

字符串

错误的进一步描述。

msg

字符串

唯一标识该请求的ID，可用于定位问题。

data

JSON对象

API(业务)相关的返回数据。出错情况下，该字段可能为空。一般来说，该字段为一个JSON结构体或数组，参见下表

响应返回的data参数说明

字段

类型

是否必选

说明

code

整型

错误码，和HTTP的status code一致。

msg

字符串

错误的进一步描述。

taskId

字符串

该检测任务的ID。

content

字符串

对应请求的内容。

results

JSON数组

返回结果。调用成功时(code=200)，返回结果中包含一个或多个元素。每个元素是个结构体，具体结构描述见result结构表。

响应返回的results中JSON对象结构说明

字段

类型

是否必选

说明

label

字符串

检测结果的分类，与具体的scene对应。取值范围参考scene和label说明。

scene

字符串

检测场景，和调用请求中的场景对应(antispam)。

suggestion

字符串

建议的结果，取值范围：

• pass：正常

• review：疑似违规

• block：确认违规

rate

浮点数

结果为该分类的概率，取值范围为[0.00-100.00]。值越高，表示越有可能属于该分类。说明分值仅供参考，建议关注label和suggestion内容。

details

JSON数组

命中风险的详细信息。具体结构描述见detail结构体说明。

detail结构体说明

字段

类型

是否必选

说明

label

字符串

文本命中风险的分类，与具体的scene对应。取值范围参考scene和label说明。

contexts

数组

命中该风险的上下文信息。具体结构描述见context说明。

scene和label说明

功能

scene

label

垃圾文本检测

antispam

• normal：正常文本

• spam：含垃圾信息

• ad：广告

• politics：涉政

• terrorism：暴恐

• abuse：辱骂

• porn：色情

• flood：灌水

• contraband：违禁

• meaningless：无意义

• customized：自定义(比如命中自定义关键词)

计费说明

服务价格

调用量( 次/月)

单价(元/千次)

<15万

1.38

<150万

1.30

<500万

1.22

<1000万

1.15

<2000万

1.08

2000万条以上

1.00

计费示例

某公司2019年5月使用该服务，共发起25万次请求，则当月使用该服务的费用为150*1.38+100*1.30=337.0元

本文标签：文本阿里反垃圾 dora Storm

版权声明：本文标题：dora storm 文本_阿里文本反垃圾服务内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1727773894a1128884.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

阿里云、腾讯云、华为云服务器四大性能测试比拼（附详细数据）

3天前

近期世界杯的开幕让大家开始关注直播业务背后几家云厂商的实力。低延迟、高音质、高画质是所有视频主对直播业务的基本诉求，这就需要公有云具备强大的云端编解码能力，以及更大的带宽资源和网络质量。至于真

阿里云服务器实现内网互通

3天前

目前，大部分情况下都可以实现内网互通。不同点在于配置方式以及价格。分许多种情况：大家可以使用智能在线进行咨询。关键字：两台ECS服务器如何内网互通。判断 ①您的

【五一专属】阿里云ECS大测评#五一专属|向所有热爱分享的“技术劳动者”致敬#

3天前

本篇博客参与阿里云 ECS实例测评，这里采用阿里的C5.large计算型实例本次对云服务器ECS产品能力的体验和建议，可帮助其他用户选用云服务,使用云服务器ECS创建应用场景测评首先对实例

【阿里云服务器】外网无法访问tomcat下部署的项目

3天前

问题提出：在ESC实例上部署了jdk和tomcat，启动tomct后，内网可以访问8080端口，外网无法访问8080. 系统环境&#xff1a

只要一个软件让电脑硬盘瞬间扩容10T空间 | 阿里云盘变本地硬盘。

3天前

小伙伴们注意：公众号的推送机制不再按照时间前后推送了，微信公众号信息流乱序。君哥建议大家把科技毒瘤君公众号置顶（设为星标⭐），以便

阿里云服务器可以用来干什么？

3天前

云服务器相当于一台可以远程的电脑，可以做很多有趣的事情，选择云服务器就跟选择电脑一样，当然相对较高的配置更好用，但是基于成本，需要

》文本工具：如何使用Office 2019 for Mac和 Mac App Store

2天前

Microsoft 365 家庭版 Office for Mac，使用mac时，想使用office软件其实很痛苦，有些时候下载了却不能使用，看了官网的解

如何把阿里云盘变成本地硬盘

1天前

今天带来的是一个好用的工具，此工具可以把阿里云盘变成本地硬盘功能：查看文件夹大小、使用第三方播放器播放视频、文件重命名等 Windows版安装方法： 分享链接:「阿里云盘变本

阿里云栖大会的现场，到底是个什么样？

1天前

9月25日至27日，一年一度的阿里云栖大会如期召开。小枣君有幸前往参观，受益匪浅。以下，就是我从现场带回的最新报道。云栖大会的举办地点是杭州西南角落的阿里云栖小镇。这个

在网页中嵌入QQ聊天、阿里旺旺聊天、邮件发送等代码

1天前

添加代码后，在网页的添加代码位置显示出聊天软件的图标，图标可以设置成不同的形式，在线就正常，不在线就呈灰色。。。 1.在网页中添加QQ图标显示代码&a

ABAP 屏幕展示长文本 SAP

1天前

本次展示的主要是，屏幕上显示长文本内容。屏幕上展示长文本，需要用到定制控制这个屏幕控件，大概是这样的代码放在PBO里面，注意定义的东西要定义为全局变量，因为PBO每次都会刷新执行一遍代码。 **屏幕控件 DATA: go_fjbm

重定向：重定向到文本的同时在屏幕输出，2＞devnull，2＞&1

1天前

1、每个 UnixLinux 命令运行时都会打开三个文件： 标准输入文件(stdin)：stdin的文件描述符为0，Unix程序默认从stdin读取数据。标准输出文件(s

2024年最新数据库资源集合_jm520(1)，阿里、百度等大厂技术面试题汇总

10小时前

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对I

百度阿里腾讯 BAT笔试题目

9小时前

 8月15日，百度2道面试题： 1、来自《编程之美》的概率题：一个桶里面有白球、黑球各100个，现在按下

2014-百度阿里华为笔试题

9小时前

8月15日，百度2道面试题： 1、来自《编程之美》的概率题：一个桶里面有白球、黑球各100个，现在按下述规则取球：的 i

阿里云视频点播的使用

2小时前

本人是一名物联网工程专业的学生，写博客即是为了记录自己的学习历程，又希望能够帮助到很多和自己一样处于起步阶段的萌新。临渊羡鱼，不如退而结网。一起加油！

新增11条新规约，阿里Java开发手册|黄山版，拥抱规范，远离伤害

2小时前

前言阿里开发手册是阿里近万名开发同学集体智慧的结晶，以开发视角为中心，详细列举如何开发更加高效、更加容错、更加有协作性，力求知其然，更知其不然，结合正反例，让Java开发者能够提升协作效率、提高代码质量。全部笔记内容和答案解析都整理成