Seiriryu commited on
Commit
c9c2322
·
1 Parent(s): cf4dd82

Upload 8 files

Browse files
Files changed (7) hide show
  1. README.md +199 -0
  2. chatyuan_wechat.jpg +0 -0
  3. config.json +30 -0
  4. pytorch_model.bin +3 -0
  5. spiece.model +3 -0
  6. spiece.vocab +0 -0
  7. tokenizer_config.json +1 -0
README.md ADDED
@@ -0,0 +1,199 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ inference:
3
+ parameters:
4
+ max_length: 250
5
+ temperature: 0.7
6
+ top_p: 1
7
+ license: creativeml-openrail-m
8
+ widget:
9
+ - text: 用户:帮我写个请假条,我因为新冠不舒服,需要请假3天,请领导批准\n小元:
10
+ - text: 用户:新冠什么症状?\n小元:新冠是指新型冠状病毒,其症状包括发热、干咳、乏力、嗅味觉减退、呼吸困难等。\n用户:可以吃什么药?\n小元:根据您提供的病史,目前没有明确的抗新冠病毒的药物,建议您在家进行自我隔离,避免与他人接触,多喝开水,清淡易消化饮食,避免熬夜和过度劳累,适当进行户外活动。\n用户:用什么后遗症么?\n小元:
11
+ ---
12
+
13
+ <a href="https://colab.research.google.com/drive/1ZcLIJuemiojigrfjbsDMBWrX7JqXZX6I?usp=sharing">
14
+ <img src="https://colab.research.google.com/assets/colab-badge.svg"></a>
15
+
16
+ ChatYuan: 元语功能型对话大模型
17
+
18
+ 这个模型可以用于问答、结合上下文做对话、做各种生成任务,包括创意性写作,也能回答一些像法律、新冠等领域问题。它基于PromptCLUE-large结合数亿条功能对话多轮对话数据进一步训练得到。
19
+
20
+ <a href='https://www.cluebenchmarks.com/clueai.html'>PromptCLUE-large:</a>在1000亿token中文语料上预训练,累计学习1.5万亿中文token,并且在数百种任务上进行Prompt任务式训练。针对理解类任务,如分类、情感分析、抽取等,可以自定义标签体系;针对多种生成任务,可以进行采样自由生成。
21
+
22
+ <a href='https://www.clueai.cn/chat' target="_blank">在线Demo(微信搜索小程序“元语智能”)</a> &nbsp; |
23
+ <a href='https://www.clueai.cn' target="_blank">使用API(large版)</a> &nbsp; |
24
+ &nbsp; <a href='https://github.com/clue-ai/ChatYuan' target="_blank">Github项目地址</a>&nbsp; |
25
+ &nbsp;<a href='https://colab.research.google.com/drive/1ZcLIJuemiojigrfjbsDMBWrX7JqXZX6I?usp=sharing#scrollTo=QokO0pdGmAYH' target="_blank">Colab在线试用</a>
26
+ &nbsp;<a href='https://mp.weixin.qq.com/s/-axa6XcjGl_Koeq_OrDq8w' target="_blank">文章介绍</a>
27
+
28
+ 微信扫码在线体验:
29
+
30
+ <img src="https://huggingface.co/ClueAI/ChatYuan-large-v1/resolve/main/chatyuan_wechat.jpg" width="30%" height="30%" />
31
+
32
+
33
+ 加载模型:
34
+
35
+ ```python
36
+ # 加载模型
37
+ from transformers import T5Tokenizer, T5ForConditionalGeneration
38
+ tokenizer = T5Tokenizer.from_pretrained("ClueAI/ChatYuan-large-v1")
39
+ model = T5ForConditionalGeneration.from_pretrained("ClueAI/ChatYuan-large-v1")
40
+ ```
41
+
42
+ 使用模型进行预测推理方法:
43
+ ```python
44
+ # 使用
45
+ import torch
46
+ from transformers import AutoTokenizer
47
+ # 修改colab笔记本设置为gpu,推理更快
48
+ device = torch.device('cuda')
49
+ model.to(device)
50
+ def preprocess(text):
51
+ text = text.replace("\n", "\\n").replace("\t", "\\t")
52
+ return text
53
+
54
+ def postprocess(text):
55
+ return text.replace("\\n", "\n").replace("\\t", "\t")
56
+
57
+ def answer(text, sample=True, top_p=1, temperature=0.7):
58
+ '''sample:是否抽样。生成任务,可以设置为True;
59
+ top_p:0-1之间,生成的内容越多样'''
60
+ text = preprocess(text)
61
+ encoding = tokenizer(text=[text], truncation=True, padding=True, max_length=768, return_tensors="pt").to(device)
62
+ if not sample:
63
+ out = model.generate(**encoding, return_dict_in_generate=True, output_scores=False, max_new_tokens=512, num_beams=1, length_penalty=0.6)
64
+ else:
65
+ out = model.generate(**encoding, return_dict_in_generate=True, output_scores=False, max_new_tokens=512, do_sample=True, top_p=top_p, temperature=temperature, no_repeat_ngram_size=3)
66
+ out_text = tokenizer.batch_decode(out["sequences"], skip_special_tokens=True)
67
+ return postprocess(out_text[0])
68
+ print("end...")
69
+ ```
70
+
71
+ # 问答、写作与功能型助手
72
+ ```python
73
+ input_text0 = "帮我写一个请假条,我因为新冠不舒服,需要请假3天,请领导批准"
74
+ input_text1 = "你能干什么"
75
+ input_text2 = "用英文写一封道歉的邮件,表达因为物流延误,不能如期到达,我们可以赔偿贵公司所有损失"
76
+ input_text3 = "写一个文章,题目是未来城市"
77
+ input_text4 = "写一个诗歌,关于冬天"
78
+ input_text5 = "从南京到上海的路线"
79
+ input_text6 = "学前教育专业岗位实习中,在学生方面会存在问题,请提出改进措施。800字"
80
+ input_text7 = "根据标题生成文章:标题:屈臣氏里的化妆品到底怎么样?正文:化妆品,要讲究科学运用,合理搭配。屈臣氏起码是正品连锁店。请继续后面的文字。"
81
+ input_text8 = "帮我对比几款GPU,列出详细参数对比,并且给出最终结论"
82
+ input_list = [input_text0, input_text1, input_text2, input_text3, input_text4, input_text5, input_text6, input_text7, input_text8]
83
+ for i, input_text in enumerate(input_list):
84
+ input_text = "用户:" + input_text + "\n小元:"
85
+ print(f"示例{i}".center(50, "="))
86
+ output_text = answer(input_text)
87
+ print(f"{input_text}{output_text}")
88
+ ```
89
+
90
+ =======================示例0========================
91
+ 用户:帮我写一个请假条,我因为新冠不舒服,需要请假3天,请领导批准
92
+ 小元:尊敬的领导:
93
+
94
+ 您好!
95
+
96
+ 因为最近新冠病毒的流行,我感到身体不舒服,所以请求请假3天,在这段时间内,我将积极配合医生的治疗,保证充足的睡眠,并做好防护工作。
97
+
98
+ 在此期间,我保证将努力完成我的工作,并按时下班,在请假期间,我绝对遵守公司的规章制度,接受公司的监督和检查,请领导批准。
99
+ 谢谢!
100
+
101
+ 此致
102
+
103
+ 敬礼!
104
+
105
+ =======================示例1========================
106
+ 用户:你能干什么
107
+ 小元:您好!我是元语AI。我可以回答您的问题、写文章、写作业、翻译,对于一些法律等领域的问题我也可以给你提供信息。
108
+ =======================示例2========================
109
+ 用户:用英文写一封道歉的邮件,表达因为物流延误,不能如期到达,我们可以赔偿贵公司所有损失
110
+ 小元:E-mail apologies to your company for not reaching your delivery due to delay in logistics, we can compensate you for all losses.
111
+ =======================示例3========================
112
+ 用户:写一个文章,题目是未来城市
113
+ 小元:未来的城市是怎样的呢?
114
+
115
+ 未来城市拥有很多不同的功能,如智慧城市、智能交通系统、远程医疗系统、智能家居系统、智慧医疗系统等。未来城市还使用物联网技术,可以远程控制,使用远程操控和传感器来监控城市的发展,帮助他们解决各种城市问题。
116
+
117
+ 未来的城市还采用互联网技术,可以让城市变得更智能,让城市变得更智慧,让每一个人都能更轻松地生活。未来城市的智能设备也可以让城市的使用者更方便地掌握他们的生活,比如智能的智能交通系统和远程医疗系统和智能的安防系统等,可以提供他们更多的便利。
118
+ 总之,未来城市的愿景是,让所有城市的使用者都能拥有一个美好的未来,让他们可以在自己的城市享受美好的生活。
119
+ =======================示例4========================
120
+ 用户:写一个诗歌,关于冬天
121
+ 小元:冬夜寂静冷,
122
+ 云在天边飘,
123
+ 冰封白雪上,
124
+ 寒冷像一场雪。
125
+
126
+ 雪花融化成冰,
127
+ 像那雪花飘洒,
128
+ 在寒冷的冬天,
129
+ 感受春天的喜悦。
130
+ 冬日里,
131
+ 风雪渐消,
132
+ 一片寂静,
133
+ 把快乐和温暖带回家。
134
+ =======================示例5========================
135
+ 用户:从南京到上海的路线
136
+ 小元:你好,南京到上海的路线如下:
137
+
138
+ 1. 南京到上海,可以乘坐南京地铁1号线,在南京站乘坐轨道交通1号线。
139
+
140
+ 2. 南京到浦东机场,可以搭乘上海地铁1号,在陆家嘴站乘坐地铁1线,在浦东国际机场站乘坐机场快线,前往上海浦东国际机场。
141
+
142
+ 3. 上海到南京,可以换乘上海地铁2号线,从南京站换乘地铁2线,再从南京南站换乘地铁1路,然后到达上海站。
143
+
144
+ =======================示例6========================
145
+ 用户:学前教育专业岗位实习中,在学生方面会存在问题,请提出改进措施。800字
146
+ 小元:在学前教育专业岗位实习中,在学生方面会存在一些问题,如学生缺少专业知识、缺乏合作意识、缺乏基本的责任心等等,需要我们采取措施,来解决这些问题。
147
+
148
+ 首先,在实习过程中,我们需要培养学生的团队意识,加强学生与老师之间的合作,加强与家长之间的沟通,提高他们的沟通能力。另外,我们也需要加强学生的独立性,让学生学会独立思考,学会和老师、家长进行沟通,培养其独立性。
149
+ 此外,在日常的工作中,我们也要为学生提供适当的机会和机会,让学生多接触社会、多参加社会活动,加深他们对社会、学校的认识,培养他们主动、积极和创新的精神。
150
+ 最后,我们还需要重视学生在实习中出现的问题,尤其是学生缺乏合作,有依赖心理,不懂得分享,有拖延行为等,这些学生应该引起我们的重视,制定合理的改进措施,改善这些问题。
151
+ =======================示例7========================
152
+ 用户:根据标题生成文章:标题:屈臣氏里的化妆品到底怎么样?正文:化妆品,要讲究科学运用,合理搭配。屈臣氏起码是正品连锁店。请继续后面的文字。
153
+
154
+ 小元:在屈臣氏买东西,要讲究科学运用,合理搭配。屈臣家起码是正品连锁店。下面,我就拿“化妆品”来说说屈臣家的化妆品。“化妆品”(护肤品、粉底液)产品种类多,产品品牌多,销售方式多样,产品种类比较齐全。屈氏是全港最大最大的化妆品超市之一。屈购是屈臣买日用品有限公司的简称。屈购物品在屈购商场经营,在屈购物市经营的屈购公司有7家,分别是:屈购商城、屈购超市、屈取电器、屈拿电器、悦活、悦养、雅活,在“屈购”经营的商品有:洗发水、眼霜、口红、面霜、润肤露、面膜、洗发精、沐浴露、香皂、化妆品、沐浴产品、洁肤产品、洗衣液、护发素、洗护用品、化妆品用品、男士化妆品。屈买商品有:护肤霜、护肤粉底霜、眼影、指甲油、香水、身体洗发露、防晒产品、防晒用品、润发产品、美容工具、化妆品等。屈商的化妆品品种繁多,种类繁多,其中化妆品有100多种,占香港商品总量的
155
+ =======================示例8========================
156
+ 用户:帮我对比几款GPU,列出详细参数对比,并且给出最终结论
157
+ 小元:一、显存容量:
158
+
159
+ 1 GeForce GTX 880 显存类型:GDDR5
160
+ 2 Geforce RTX 1060 显存在类型:PhysX物理加速
161
+ 3 Ge force MX150 显存在于类型:SLI
162
+ 4 GetoDirectX 11:支持DX11
163
+ 二、显显存带宽:
164
+ 1.GDDR4X 显显容量:256MB
165
+ 2.GDDR6X 最大显存范围:8GB
166
+ 3.GDDR3 显在带宽:120GB
167
+ 4.GDDR7 显适用于2GB显存
168
+ 三、显效时间:
169
+ 1.4 GB/s
170
+ 2. 5.5 ms
171
+ 3. 5 ms
172
+
173
+ # 多轮对话
174
+ ```python
175
+ input_text = ["你好","新冠什么症状?","可以吃什么药?"]
176
+ answer_text = ["您好!我是元语AI。我可以回答您的问题、写文章、写作业、翻译,对于一些法律等领域的问题我也可以给你提供信息", "新冠是指新型冠状病毒,其症状包括发热、干咳、乏力、嗅味觉减退、呼吸困难等。", "根据您提供的病史,目前没有明确的抗新冠病毒的药物,建议您在家进行自我隔离,避免与他人接触,多喝开水,清淡易消化饮食,避免熬夜和过度劳累,适当进行户外活动。"]
177
+ context = "\n".join([f"用户:{input_text[i]}\n小元:{answer_text[i]}" for i in range(len(input_text))])
178
+ print(context)
179
+
180
+ input_text = "用什么后遗症么?"
181
+ print(f"示例".center(50, "="))
182
+ input_text = context + "\n用户:" + input_text + "\n小元:"
183
+ output_text = answer(input_text)
184
+ print(f"{input_text}{output_text}")
185
+ ```
186
+ ========================示例========================
187
+ 用户:你好
188
+ 小元:您好!我是元语AI。我可以回答您的问题、写文章、写作业、翻译,对于一些法律等领域的问题我也可以给你提供信息
189
+ 用户:新冠什么症状?
190
+ 小元:新冠是指新型冠状病毒,其症状包括发热、干咳、乏力、嗅味觉减退、呼吸困难等。
191
+ 用户:可以吃什么药?
192
+ 小元:根据您提供的病史,目前没有明确的抗新冠病毒的药物,建议您在家进行自我隔离,避免与他人接触,多喝开水,清淡易消化饮食,避免熬夜和过度劳累,适当进行户外活动。
193
+ 用户:用什么后遗症么?
194
+ 小元:目前还没有人具体说是什么后遗症,但是目前症状比较轻的,可能没有后遗症,但是如果症状比较重,就可能出现呼吸困难,胸闷,发热,咳嗽等症状。
195
+
196
+ ### 技术交流和问题反馈
197
+ <a href='https://discord.gg/hUVyMRByaE'>加入discord交流群</a>
198
+ <a href='https://github.com/clue-ai/ChatYuan#%E6%8A%80%E6%9C%AF%E4%BA%A4%E6%B5%81%E5%92%8C%E9%97%AE%E9%A2%98%E5%8F%8D%E9%A6%88%E6%89%AB%E7%A0%81%E5%9C%A8%E7%BA%BF%E4%BD%93%E9%AA%8C%E5%B0%8F%E7%A8%8B%E5%BA%8F%E6%88%96%E5%85%A5%E7%BE%A4'>加微信入讨论群</a>
199
+ <center><a href="https://clustrmaps.com/site/1bsr7" title="Visit tracker"><img src="//www.clustrmaps.com/map_v2.png?d=sFWwaZBlUeql7focpvpWJDpp9DHpvZfdw1kSavIAWqM&cl=ffffff" /></a></center>
chatyuan_wechat.jpg ADDED
config.json ADDED
@@ -0,0 +1,30 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "T5ForConditionalGeneration"
4
+ ],
5
+ "d_ff": 2816,
6
+ "d_kv": 64,
7
+ "d_model": 1024,
8
+ "decoder_start_token_id": 0,
9
+ "dense_act_fn": "gelu_new",
10
+ "dropout_rate": 0.1,
11
+ "eos_token_id": 1,
12
+ "feed_forward_proj": "gated-gelu",
13
+ "initializer_factor": 1.0,
14
+ "is_encoder_decoder": true,
15
+ "is_gated_act": true,
16
+ "layer_norm_epsilon": 1e-06,
17
+ "model_type": "t5",
18
+ "num_decoder_layers": 24,
19
+ "num_heads": 16,
20
+ "num_layers": 24,
21
+ "output_past": true,
22
+ "pad_token_id": 0,
23
+ "relative_attention_max_distance": 128,
24
+ "relative_attention_num_buckets": 32,
25
+ "tie_word_embeddings": false,
26
+ "torch_dtype": "float32",
27
+ "transformers_version": "4.26.0.dev0",
28
+ "use_cache": true,
29
+ "vocab_size": 32128
30
+ }
pytorch_model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:385b6c4560e44aa86293f219fac1cded30cf7302704ddefb554524e1b68d07d0
3
+ size 3132785797
spiece.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5c2083a4dd8b56e99db4a408d68a50d4374252628247dbdc9d5931fddcf0a66d
3
+ size 742045
spiece.vocab ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"eos_token": "</s>", "unk_token": "<unk>", "pad_token": "<pad>", "extra_ids": 100, "additional_special_tokens": ["<extra_id_0>", "<extra_id_1>", "<extra_id_2>", "<extra_id_3>", "<extra_id_4>", "<extra_id_5>", "<extra_id_6>", "<extra_id_7>", "<extra_id_8>", "<extra_id_9>", "<extra_id_10>", "<extra_id_11>", "<extra_id_12>", "<extra_id_13>", "<extra_id_14>", "<extra_id_15>", "<extra_id_16>", "<extra_id_17>", "<extra_id_18>", "<extra_id_19>", "<extra_id_20>", "<extra_id_21>", "<extra_id_22>", "<extra_id_23>", "<extra_id_24>", "<extra_id_25>", "<extra_id_26>", "<extra_id_27>", "<extra_id_28>", "<extra_id_29>", "<extra_id_30>", "<extra_id_31>", "<extra_id_32>", "<extra_id_33>", "<extra_id_34>", "<extra_id_35>", "<extra_id_36>", "<extra_id_37>", "<extra_id_38>", "<extra_id_39>", "<extra_id_40>", "<extra_id_41>", "<extra_id_42>", "<extra_id_43>", "<extra_id_44>", "<extra_id_45>", "<extra_id_46>", "<extra_id_47>", "<extra_id_48>", "<extra_id_49>", "<extra_id_50>", "<extra_id_51>", "<extra_id_52>", "<extra_id_53>", "<extra_id_54>", "<extra_id_55>", "<extra_id_56>", "<extra_id_57>", "<extra_id_58>", "<extra_id_59>", "<extra_id_60>", "<extra_id_61>", "<extra_id_62>", "<extra_id_63>", "<extra_id_64>", "<extra_id_65>", "<extra_id_66>", "<extra_id_67>", "<extra_id_68>", "<extra_id_69>", "<extra_id_70>", "<extra_id_71>", "<extra_id_72>", "<extra_id_73>", "<extra_id_74>", "<extra_id_75>", "<extra_id_76>", "<extra_id_77>", "<extra_id_78>", "<extra_id_79>", "<extra_id_80>", "<extra_id_81>", "<extra_id_82>", "<extra_id_83>", "<extra_id_84>", "<extra_id_85>", "<extra_id_86>", "<extra_id_87>", "<extra_id_88>", "<extra_id_89>", "<extra_id_90>", "<extra_id_91>", "<extra_id_92>", "<extra_id_93>", "<extra_id_94>", "<extra_id_95>", "<extra_id_96>", "<extra_id_97>", "<extra_id_98>", "<extra_id_99>"], "model_max_length": 512, "name_or_path": "t5-base"}