我在做数据的特征处理的时候,需要对类别数据进行整数编码。结果出现如下错误:

TypeError: Encoders require their input to be uniformly strings or numbers. Got ['float', 'int', 'str']

这个错误通常是因为在使用编码器对数据进行处理时,输入的数据类型不一致。解决方案就是将所有的数据统一转换为同一数据类型,比如将所有数据转换为字符串或数值。

原代码

from sklearn.preprocessing import LabelEncoder
    label_encoder = LabelEncoder()
    for col in cols:
        df3[col] = label_encoder.fit_transform(df3[col])

其中,cols为需要转换的类别数据所在列的列名组成的列表,df3为整个数据的dataFrame。

修改之后

from sklearn.preprocessing import LabelEncoder    
    label_encoder = LabelEncoder()
    for col in cols:
        df3[col] = df3[col].astype(str)
        df3[col] = label_encoder.fit_transform(df3[col])

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐