本发明提供的一种利用单词信息聚类的句子编码方法。在一个实施例中,将特定长度句子序列中的各个单词映射到词向量空间中,并获取各个单词的词向量;获取各个词向量的编码向量并将各个编码向量经过非线性挤压作为一个胶囊;获取多个胶囊形成原始胶囊层,利用胶囊协议算法从原始胶囊层中抽出具有特定语义特征的单词的语义信息,形成第一目标胶囊层;对第一目标胶囊层中的第一目标胶囊利用胶囊协议算法进行信息转化形成具有分类个数的第二目标胶囊层。通过采用胶囊协议算法,根据目标胶囊对于原始胶囊的不同要求,进行信息的传递,能够获取更长的句子特征,并能有效提高句子分类的准确性。