Python Drop duplicates to ignore case sensitive

Question

I want to delete duplicates from the below df, preserving the case sensitivity.

Input df

df = pd.DataFrame({
    'company_name': ['Apple', 'apple','apple', 'BlackBerry', 
    'blackberry','Blackberry']
})

Expected df

        company_name
0   Apple
1   apple
2   BlackBerry
3   blackberry
4   Blackberry

score 1 · Answer 1 · answered Feb 01 '23 at 19:37

1

You can use drop_duplicates with ignore_index=True:

df.drop_duplicates(ignore_index=True)

This outputs:

  company_name
0        Apple
1        apple
2   BlackBerry
3   blackberry
4   Blackberry

answered Feb 01 '23 at 19:37

BrokenBenchmark

1 Answers1