数据科学图书馆

nami的Python项目详细描述


纳米语

nami是python包

安装

pip install --upgrade nami

特性(nami-1.2.0.1)

获取数据集

fromnami.datasets.ImageNetimportget_datasetdataset=get_dataset(noun='STR',dimension=(INT,INT),max=INT,timeout=FLOAT,save_to='STR')

get 'INT*INT dimenstion' of 'noun' image dataset from ImageNet.
timeout - [from 0.1 - 1.0] maximum time request for each image URL. max - number of images dataset. save_to - save the dataset by '.npy' format.

加载数据集(KME)

^{pr2}$

标记器类

fromnami.AI.kme_tokenizeimportTokenizertokenizer=Tokenizer()text_arr=['methyl methanoate','ethane','(hydroxymethylamino)oxy-methoxymethanol']```pythontokenizer.fit_on_text(text_arr)

fit_on_text(sentences=)
sentences: take array of string to make bag of words (word2index & index2word)

train_seq=tokenizer.text_to_sequences(text_arr,method_pad='pre')

text_to_sequences(sentences= , method_pad='post')
sentences: take array of string to preprocessing text to numeric
method_pad: ('pre', 'post') make zero padding

train_seq

[[ 0  0  0  0  0  0  0  4  5  6  4  7  8]
 [ 0  0  0  0  0  0  0  0  0  0  0  9 10]
 [11 12  4  5 13 14 15 16  4 15  4  7 17]]
test_arr=['2-(4-methoxyphenyl)-2-oxoacetic acid']test_seq=tokenizer.text_to_sequences(test_arr)# [[11, 14, 18, 13, 14, 4, 22, 3, 5, 21, 14, 11, 14, 3, 3, 3]]test_text=tokenizer.sequences_to_text(test_seq)# [['2', '-', '(', '4', '-', 'meth', 'oxy', '<unk>', 'yl', ')', '-', '2', '-', '<unk>', '<unk>', '<unk>']]

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java随机填充2d数组   java运行时。getRuntime。带有长参数的exec(cmd)   java Minecraft无法放置自定义背景   java AChartEngine YAxis自定义标签区域边距和图表值为字符串?   泛型类的java类型安全错误   整数的java符号等价物。toBinaryString方法?   Java中数组列表的数组   java WebView应用程序在谷歌登录后显示空白屏幕   java从backback中删除特定片段   如果服务器不支持使用的协议,java JSSE是否实现回退?   java Sonarqube正在进行核心漏洞查找。如何解决   javajavax。jcr。UnsupportedPositionOperationException:testVersionable处的节点不可版本化   java在安卓中每隔X小时运行一次文件/函数,无需打开应用程序   java如何为磁盘持久性配置BigMemory?   java BufferWriter不转换383以上的整数   Java7交集类型:规范具体说明了什么?   Java:CollectionHow创建多列   java如何检测运算符的空白   java问题:在firebase中为导航栏中的第二个表单提交数据第一个表单工作正常。实际isse是连接Mainactivity中的另一个活动