自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (380)
  • 论坛 (88)
  • 问答 (48)
  • 收藏
  • 关注

原创 验证集正确率为零 / 验证集远低于训练集 / 验证集全都预测同一个数

定义两个with tf.variable_scope("my_model", reuse=tf.AUTO_REUSE): model_train = MyModel(is_training=True)with tf.variable_scope("my_model", reuse=True): model_dev = MyModel(is_training=False)可能会造成model_train和model_dev实际没有共享参数,就定义一个model = MyModel(

2021-02-26 09:28:19 229 1

原创 fastjson scala, 解析 mapObject

val tmpObject: JSONObject = objArray.getJSONObject(i) if (tmpObject.containsKey("theKey")) { val theValue: String = tmpObject.getString("theKey") }

2021-02-25 11:14:30 14

原创 fastjson scala, string解析成array

val objArray: JSONArray = JSON.parseArray(tmpString) if (!Option(objArray).isEmpty) { for (i <- 0 until objArray.size()) { val tmpObject: JSONObject = objArray.getJSONObject(i) } }

2021-02-25 11:12:24 29

原创 fastjson scala, string解析成map

val tmpMap = scala.collection.mutable.HashMap[String, String]() val jObject = JSON.parseObject(inputString) if (jObject != null) { jObject.keySet().asScala.foreach(key => { tmpMap.put(key, jObject.getString(...

2021-02-25 11:09:31 51

原创 spark 从Row中getAs Map

val data = row.getAs[Map[String, String]]("data")

2021-02-22 20:03:49 111

原创 tensorflow tf.nn.conv1d 的真实含义(不是为了TextCNN而设计)

看源码https://github.com/tensorflow/tensorflow/blob/v2.4.1/tensorflow/python/ops/nn_ops.py是在卷积核的filter_height这位强行置为1,即一个宽为1的长条卷积核

2021-02-19 11:13:13 52

原创 tensorflow conv1d 代码实例 及 具体运算过程

import tensorflow as tfimport numpy as npbatch_size = 2sequence_len = 5hidden_size = 2kernel_len = 2in_channel = hidden_sizeout_channel = hidden_sizea1 = np.array(np.arange(1, 1 + sequence_len * hidden_size).reshape([sequence_len, hidden_size]), d

2021-02-18 18:58:48 69

原创 tensor transpose之后的含义探究

以卷积核为例import tensorflow as tfimport numpy as npbatch_size = 2sequence_len = 5hidden_size = 2kernel_len = 2in_channel = hidden_sizeout_channel = hidden_sizea1 = np.array(np.arange(1, 1 + sequence_len * hidden_size).reshape([sequence_len, hidden_si

2021-02-18 18:54:36 31

原创 locality-sensitive hashing 简单理解

LSH是为了将向量hash到多个桶里以索引以缩小计算向量相似度时的候选。

2021-02-18 12:13:38 67

原创 python tensor @ 操作符

就是matmul的意思a = np.array([[1, 2], [3, 4]])print(a @ a)# The answer will be [[7, 10], [15, 22]]

2021-02-15 20:39:35 77

原创 Temporal-Contextual Recommendation in Real-Time 阅读笔记

摘要本文研究个性化实时推荐,本文基于矩阵分解,结合这些信息:实时事件的次序、冷启动相关信息,商品(item)元信息,事件周边信息,提出 结合元数据的层级循环网络(HRNN-meta),提出 结合重要性采样 以更有效训练,引言个性化推荐主要用这两种信息:user-item交互历史 和 user/item本身特征,基于矩阵分解的到user和item表示,对user的事件顺序 缺乏利用,HRNN-meta将事件时间信息编码进模型输入,事件时间信息 只是contextual信息之一,还有其他con

2021-02-10 15:26:06 81

hadoop-2.2.0.tar.gz

hadoop-2.2.0.tar.gz

2015-07-29

标准的quora数据集

标准的quora pairs数据集,判断两句话是否同义,BiMPM得分ACC88,

2018-11-27

WMT14数据集

机器翻译数据集 ACL 2014 NINTH WORKSHOP ON STATISTICAL MACHINE TRANSLATION

2018-04-09

ROCStories Cloze Test 数据集

'Story Cloze Test' is a new commonsense reasoning framework for evaluating story understanding, story generation, and script learning. This test requires a system to choose the correct ending to a four-sentence story. We propose the Story Cloze Test to replace the state-of-the-art for evaluating narrative structure learning, the 'Narrative Cloze Test'

2019-02-27

大规模新闻文本分类数据集

大规模新闻文本分类数据集,有多个领域,按文件夹摆放,不仅可以用来做文本分类实验,数据不少甚至可以用来做BERT预训练

2020-07-01

蚂蚁金服文本匹配竞赛训练数据

金融大脑-金融智能NLP服务 以人工智能技术为核心的智能客服,为广大用户提供高效、个性化的普惠金融服务体验,本质是充分理解用户意图,在已有知识体系中精准地找到与之相匹配的内容,提供答案或解决...

2018-05-28

train-images-idx3-ubyte.gz 和 train-labels-idx1-ubyte.gz

train-images-idx3-ubyte.gz train-labels-idx1-ubyte.gz t10k-images-idx3-ubyte.gz t10k-labels-idx1-ubyte.gz

2020-12-03

imdb、SST-1、SST-2、yelp-2013、yelp-2014 文本分类数据集

imdb、SST-1、SST-2、yelp-2013、yelp-2014 文本分类数据集 https://github.com/JerrikEph/Capsule4TextClassification/blob/master/data/downloadDataset.md

2020-04-10

cocos2d-x 贪吃蛇

替换官方包的相应文件,VS2010可运行

2012-02-04

_bz2.cpython-36m-x86_64-linux-gnu.so

Python3.6的bz2模块需要的so文件,可复制到lib/python3.6/lib-dynload使用

2017-10-30

scipy-0.16.1-cp27-none-win_amd64.whl

scipy-0.16.1-cp27-none-win_amd64.whl

2016-01-08

Facebook bAbI dataset

Facebook bAbI dataset Facebook bAbI dataset Facebook bAbI dataset Facebook bAbI dataset Facebook bAbI dataset

2017-03-06

_sqlite3.cpython-36m-x86_64-linux-gnu.so

Python 3.6的sqlite3的so文件,放到lib/python3.6/lib-dynload解决No module named '_sqlite3'问题

2018-05-29

知识图谱 family 数据集

家庭背景的知识图谱三元组数据, entities.txt facts.txt relations.txt test.txt train.txt valid.txt

2018-03-15

scipy-0.18.1-cp35-cp35m-win_amd64.whl

scipy-0.18.1-cp35-cp35m-win_amd64.whl

2016-12-21

pytorch resnet 101 模型参数数据

pytorch resnet 101 模型参数数据 pytorch resnet 101 模型参数数据 pytorch resnet 101 模型参数数据 pytorch resnet 101 模型参数数据 pytorch resnet 101 模型参数数据

2017-12-29

cityscapes数据集

cityscapes数据集,pix2pix模型用的。 Semantic, instance-wise, dense pixel annotations of 30 classes

2019-04-08

glove.42B.300d 词向量

著名的glove词向量,上Billion个词,每个词N维,可用于深度模型初始化,BERT之后仍有其价值

2020-07-06

基于知识图谱的问答系统综述

Question Answering over Knowledge Bases

2016-09-19

chinese_L-12_H-768_A-12.zip

https://github.com/google-research/bert 里的预训练好的模型,中文的

2020-06-21

TextCNN在文本分类的应用.pptx

TextCNN在文本分类的应用,深入浅出,通俗易懂,图是自己画的。

2019-05-31

mnist数据 tfrecords版本

数据读法: https://gitee.com/779222056/capsule-net/tree/master/input_data/mnist

2018-03-06

cudnn 7.6.4 linux

cudnn 7.6.4 的so文件,配合cuda10.0,配合TensorFlow1.14,export LD_LIBRARY_PATH使用

2020-04-15

机器翻译WMT14数据集

机器翻译WMT14数据集,ACL2014公布的share task,很多模型都在这上benchmark

2018-04-09

aclImdb_v1.tar.gz

https://huggingface.co/transformers/custom_datasets.html#seq-imdb 用到的数据

2020-11-19

glove.840B.300d-char.txt

character level(字母字符级)的glove embedding https://github.com/minimaxir/char-embeddings

2017-12-11

整理过的金庸TXT训练集

整理过的金庸TXT训练集,包括16本书,和全部16本放一个TXT文件里的一个文件

2019-03-14

NLTK wordnet.zip

id: wordnet; size: 10775600; author: ; copyright: WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved.; license: Permission to use, copy, modify and distribute this software and database and its documentation for any purpose and without fee or royalty is hereby granted, provided that you agree to comply with the following copyright notice and statements, including the disclaimer, and that the same appear on ALL copies of the software, database and documentation, including modifications that you make for internal use or for distribution.... [see webpage for full license];

2019-12-01

libcublas.so.9.0

错误:ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory cudnn-9.0-linux-x64-v7.1

2018-05-29

NELL-995 知识图谱 数据集

Format of the dataset raw.kb: the raw kb data from NELL system kb_env_rl.txt: we add inverse triples of all triples in raw.kb, this file is used as the KG for reasoning entity2vec.bern/relation2vec.bern: transE embeddings to represent out RL states, can be trained using TransX implementations by thunlp tasks/: each task is a particular reasoning relation tasks/${relation}/*.vec: trained TransH Embeddings tasks/${relation}/*.vec_D: trained TransD Embeddings tasks/${relation}/*.bern: trained TransR Embedding trained tasks/${relation}/*.unif: trained TransE Embeddings tasks/${relation}/transX: triples used to train the KB embeddings tasks/${relation}/train.pairs: train triples in the PRA format tasks/${relation}/test.pairs: test triples in the PRA format tasks/${relation}/path_to_use.txt: reasoning paths found the RL agent tasks/${relation}/path_stats.txt: path frequency of randomised BFS

2018-03-28

知乎文本分类竞赛 数据集2/2

https://biendata.com/competition/zhihu/ 参赛者需要根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型。 标注数据中包含 300 万个问题,每个问题有 1 个或多个标签,共计1999 个标签。每个标签对应知乎上的一个「话题」

2018-07-16

知乎文本分类竞赛 数据集1/2

https://biendata.com/competition/zhihu/ 参赛者需要根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型。 标注数据中包含 300 万个问题,每个问题有 1 个或多个标签,共计1999 个标签。每个标签对应知乎上的一个「话题」

2018-07-16

bochs-2.6.2 .tar.gz

bochs-2.6.2 .tar.gz

2013-06-14

nlpcc 2018 知识图谱 数据集

Task 7 - Open Domain Question Answering In this year’s NLPCC open domain QA share task, we focus on KNOWLEDGE and propose three sub-tasks, including (a) knowledge-based question answering (KBQA), (b) knowledge-based question generation (KBQG), and (c) knowledge-based question understanding (KBQU). The task of KBQA is to answer natural language questions based on a given knowledge base. The task of KBQG is to generate natural language questions based on given knowledge base triples. The task of KBQU is to transform natural language questions into their corresponding logical forms. The first two sub-tasks are in Chinese, while the last sub-task is in English.

2018-03-28

cuda_10.0.130_410.48_linux.run

cuda10 CentOS7 Linux runfile 安装文件,网速慢的用户用, 安装前要先禁用nouveau,

2020-06-21

Python-3.6.8.tgz

Python-3.6.8源码安装包 ./configure --prefix=/your_path make make install

2019-12-16

维基百科中文预训练数据

用于BERT预训练,Bidirectional Encoder Representation from Transformers

2020-07-10

PTB数据集和baseline

Penn Tree Bank (PTB) dataset, is widely used in machine learning of NLP (Natural Language Processing) research.

2019-03-01

glove.840B.300d.txt 压缩包1/2

GloVe is an unsupervised learning algorithm for obtaining vector representations for words. Training is performed on aggregated global word-word co-occurrence statistics from a corpus, and the resulting representations showcase interesting linear substructures of the word vector space.

2018-04-11

Facebook的SimpleQuestions数据集

https://research.fb.com/downloads/babi/ https://research.fb.com/downloads/babi/ https://research.fb.com/downloads/babi/ https://research.fb.com/downloads/babi/ https://research.fb.com/downloads/babi/

2017-03-29

编译时 java -d 是什么意思?

发表于 2011-01-20 最后回复 2020-03-26

android 怎么输出变量的的值到log

发表于 2011-06-09 最后回复 2020-03-12

guotong1988的留言板

发表于 2020-01-02 最后回复 2020-01-02

请问linux里的 # 和 $ 都有什么意思啊?

发表于 2011-01-24 最后回复 2018-06-19

问下付费VIP能扩大上传资源权限到500M吗

发表于 2017-12-04 最后回复 2017-12-04

怎么用html里的button里的onclick的运行一段java

发表于 2011-02-23 最后回复 2017-09-30

linux里面有很多goto,为什么明确不提倡用goto

发表于 2012-01-14 最后回复 2017-08-05

华为手机的AI部门 和 联想的AI部门 去哪个

发表于 2016-11-20 最后回复 2016-11-21

做AI的话是搞 底层框架大牛 和 应用层业务大牛 哪个有前途?

发表于 2016-11-20 最后回复 2016-11-21

什么情况下用plsql?

发表于 2015-03-12 最后回复 2016-10-26

为什么我是博客专家了还是不能把微博搞上

发表于 2016-01-25 最后回复 2016-01-28

创业公司老板兼CTO把我们看成打杂的怎么办???

发表于 2014-11-14 最后回复 2016-01-15

一段scala代码读不懂。。。

发表于 2015-03-02 最后回复 2015-04-22

jsp问题,入门级,求助啊!!! 搜遍了网上方法,(附图)

发表于 2015-03-18 最后回复 2015-03-24

Java 线程共用run方法里的代码段吗?

发表于 2014-11-24 最后回复 2015-03-02

为什么列式数据库适用于OLAP,行式数据库适用于OLTP?

发表于 2014-10-18 最后回复 2015-03-02

问下搞机器学习的童鞋,都用什么数据库,还是不用数据库?

发表于 2015-02-05 最后回复 2015-03-02

如何把 linux0.11更高的版本 用bochs编译并运行

发表于 2014-12-23 最后回复 2015-03-02

小弟今年27了,该不该跳这个槽,明天给那边回复

发表于 2015-02-01 最后回复 2015-03-02

有多少人和我一样觉得老板兼CTO从不考虑员工所想的

发表于 2014-11-11 最后回复 2015-01-04

从mysql、oracle、sqlserver、db2里取数据,怎样取最快?

发表于 2014-11-12 最后回复 2014-11-19

世界上有哪些非计算机专业出身的IT精英?

发表于 2014-11-09 最后回复 2014-11-11

求推荐一款优秀的开源的数据库管理工具,可以支持mysql、oracle、sqlserver、db2等。

发表于 2014-11-06 最后回复 2014-11-09

the import com.mysql can not be resolved 请问

发表于 2011-02-21 最后回复 2014-10-31

怎么把 指针b的指向的地址作为值 放到指针a指向的地址里?

发表于 2014-10-19 最后回复 2014-10-19

Java,我有一个外网IP比如7.7.7.7:port的server,想和一内网192.168.0.13client通信,server端求个java小例子

发表于 2013-08-27 最后回复 2014-10-18

windows核心编程 看不懂

发表于 2012-02-25 最后回复 2014-03-14

各位大侠,什么书有讲C++多线程的知识?

发表于 2012-02-20 最后回复 2013-08-27

各位大侠,什么书里有讲P,V操作的?

发表于 2012-03-04 最后回复 2013-08-27

as3 addchild() 的机制????????

发表于 2011-09-05 最后回复 2013-07-28

如何实现比如五子棋的联机对战,在iphone上,主要是网络编程方面

发表于 2011-06-10 最后回复 2012-11-23

谁帮我详细解释下这句: <script type="text/javascript">

发表于 2011-02-21 最后回复 2012-09-20

比如做一个 绑定IE首页的程序 需要什么知识?看什么书?

发表于 2012-02-19 最后回复 2012-02-20

做游戏 美工 和 程序 可否都学?

发表于 2012-02-16 最后回复 2012-02-19

各位大侠 想做游戏 程序 和 美工 可不可以都学?

发表于 2012-02-16 最后回复 2012-02-19

哪里可以做业余项目?

发表于 2012-02-05 最后回复 2012-02-16

大家怎么看 程序实现 和 更好的实现 这件事?

发表于 2011-11-01 最后回复 2012-01-20

大家怎么看 程序功能实现 和 更好的实现 这件事?

发表于 2011-11-01 最后回复 2011-11-11

android的调试速度怎么这么慢

发表于 2011-10-28 最后回复 2011-11-01

大家怎么看 实现 与 更好的实现 这件事???????

发表于 2011-10-28 最后回复 2011-11-01

现在我工作就是提升APP用户点击率,可以推荐个为国为民的计算机方向吗?

2021-05-23

所谓的RNN不能并行到底指的什么?跟数据并行训练冲突吗?

2021-03-26

有没有一些在java+cpu训练机器学习模型的方案?

2021-05-11

我们代码里的learning rate是一个batch总的学习率还是一个data的学习率?

2021-04-28

有没有办法在map里面得到Spark的worker信息,然后固定仅让那一个worker输出日志?

2021-04-15

2021年了,主流神经网络是不是可以说就是transformer、RNN、CNN三种基础模块了?

2021-03-26

除了#TODO在pycharm还有哪些高亮的注释?

2021-03-26

问下有人知道和BERT论文用的一模一样的预训练源数据从哪找吗

2021-03-23

CTR模型的交互类的特征是怎么做的和存储的?

2021-03-19

解决 Spark OOM 有哪些基本思路?

2021-03-19

多GPU数据并行训练的加速原理到底是什么?

2021-02-18

2021年了,有哪些稳压bert和roberta的预训练模型?

2021-01-20

现在机器学习的库都是Python的,而服务器貌似是Java性能最好,怎么处理这个问题?

2016-11-22

gdb都能调试什么类型的文件?

2016-10-17

Spark里一行scala代码看不懂?

2016-02-29

spark example 有个地方看不懂

2016-02-01

maven,自己的 程序包不存在?

2015-12-03

如何寻找一个java文件的所有import的java,把这些所有java都打到一个jar包,自动化?

2015-12-03

Eclipse有办法打Jar包时自动解决(自身项目内的)依赖问题吗?

2015-12-03

google的protobuf比这样java原生的方式更有效率吗?

2015-11-19

.h文件里定义了一个类,怎么链接到so文件里?

2015-09-09

cocos2d-x lua怎么滤色?

2015-09-02

看jvm某个类的成员变量的值

2015-08-28

JAVA怎么从特定【行】开始读字串?

2015-08-24

一小段scala代码看不懂?

2015-08-21

scala如何初始化一个Tuple3数组?

2015-08-18

用jstack看到的WAITING和BLOCK的区别的是什么

2015-08-18

linux搭建spark源码环境,执行build/sdt gen-idea要twitter东西?

2015-08-14

Spark里的DAG是怎么回事?

2015-08-12

invoke方法如何加-Xmx2000M之类的VM参数

2015-08-03

spark1.2里的一小段scala代码看不懂

2015-03-03

为什么数据库要插入数据后再建B-Tree等结构的索引,而不是边插边建?

2015-03-24

Spark哪些分布式计算可以脱离HDFS跑?

2015-07-03

akka 简单例子总是 not delivered和dead letters encountered

2015-07-09

Eclipse里如何debug跟踪MapReduce程序到hadoop源码里?

2015-07-31

有没有自动生成复杂sql的软件?

2015-07-14

java swing awt, 如何实现一个按钮按下之后刷新界面

2015-07-03

java正则表达式,怎么写一个match包含空格的pattern?

2015-06-04

java正则表达式,如何表示一个非某个字符的匹配

2015-06-04

为什么hdfs不支持随机写?

2015-03-11

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除