Home IT技术 TF 2.0 SparseCategoricalCrossEntropy 异常行为

TF 2.0 SparseCategoricalCrossEntropy 异常行为

IT技术 xiaolong · 2025年5月26日 · 0 Comment

我尝试使用 SparseCategoricalCrossEntropy 进行一些自定义设置，但当概率总和不等于1时，我发现结果与预期不符。


我是不是理解错了什么？它在底层做了什么？

回答：
让我们看看keras 对 numpy 的损失函数实现：
def categorical_crossentropy(target, output, from_logits=False):
    if from_logits:
        output = softmax(output)
    else:
        output /= output.sum(axis=-1, keepdims=True)
    output = np.clip(output, 1e-7, 1 - 1e-7)
    return np.sum(target * -np.log(output), axis=-1, keepdims=False)
如你所见，输出被所有概率的总和所除，因此我们有：
-np.log(.89/(.5 + .89 + .6)) # 0.8046684549923527



相关文章：

相同的Keras模型在Ubuntu和Windows之间得到不同的结果？
多对多分类使用Keras LSTM
ValueError: 分类指标无法处理多标签指示器和二元目标的混合
如何在Keras中为Inception V3设置自定义的input_shape？
Keras: 两个同时进行的层，其中一个对前一层的输出进行卷积
Keras: 在LSTM网络中添加MDN层
在Keras中实现条件批归一化
TypeError: ‘Tensor’ 类型对象无法使用 len() 函数，当在 Tensorflow 中使用自定义度量时
在深度学习模型中使用相同代码时获得不同准确率
Keras LSTM 多错误尝试创建模型架构



	

		 auto-keras machine-learning tensorflow





	
		
		
	





	
		
		
			xiaolong
			
		
					
	



		
			Related Posts
			
									
	

		

	
		IT技术 			

	使用LSTM在Python中预测未来值
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		这段代码可以预测指定股票的当前日期之前的值，但不能预测… 
	



									
	

		

	
		IT技术 			

	如何在gensim的word2vec模型中查找双词组的相似性
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我有一个word2vec模型，假设我使用的是googl… 
	



									
	

		

	
		IT技术 			

	dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我试图使用 XGBoost 创建模型。 看起来我成功地… 
	



									
	

		

	
		IT技术 			

	ML Tuning – Cross Validation in Spark
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我在https://spark.apache.org/… 
	



									
	

		

	
		IT技术 			

	如何在React JS中使用fetch从REST API获取预测
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我正在开发一个应用程序，其中Flask REST AP… 
	



									
	

		

	
		IT技术 			

	如何分析ML.NET中多类分类预测得分数组？
	
	

	xiaolong
	·	
	2025年6月1日
	·
	0 Comment
	


	
		我在ML.NET中创建了一个多类分类项目。该项目可以对… 
	



							

		


	


		
		发表回复 取消回复
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 * 
显示名称 * 
邮箱 * 
网站 
 在此浏览器中保存我的显示名称、邮箱地址和网站地址，以便下次评论时使用。






	
	搜索


标签


2d-vector
a-star
algorithm
apache-spark
artificial-intelligence
auto-keras
bilstm
c#
c++
classification
cluster-analysis
computer-vision
conv-neural-network
cox-regression
cross-validation
data-mining
data-science
decision-tree
deep-learning
geopandas
gradient-descent
image-processing
java
keras
libsvm
linear-regression
logistic-regression
machine-learning
matlab
neural-network
nlp
numpy
openai-api
opencv
pandas
python
python-3.x
pytorch
random-forest
recurrent-neural-network
reinforcement-learning
scikit-learn
statistics
tensorflow
weka


近期文章


使用LSTM在Python中预测未来值
如何在gensim的word2vec模型中查找双词组的相似性
dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的
ML Tuning – Cross Validation in Spark
如何在React JS中使用fetch从REST API获取预测



分类


	IT技术


	
	

		
		

		

			

				
			
			
				
				© 2025 学技术
			京ICP备20017344号-7