awk. find unique values count for every element in other column

Question

Find count of a unique values in second column for every unique value in column one using awk associative arrays??

a,x  
a,y  
a,z  
a,w  
b,x  
b,y  
a,x  
b,x

o/p should be

a,4  
b,2

Hard to imagine how you could've put less effort into asking this question. — Ed Morton, Aug 20 '16 at 17:32

karakfa · Answer 1 · 2016-08-21T01:28:02.510

1

similar awk

$ awk -F, -v OFS=, '{a[$1]+=!b[$1,$2]++} END{for(k in a) print k,a[k]}' file

a,4
b,2

another approach

$ sort -u file | cut -d, -f1 | uniq -c | awk '{print $2","$1}'

edited Aug 21 '16 at 01:28

answered Aug 20 '16 at 14:12

karakfa

66,216
7
41
56

score 0 · Answer 2 · answered Aug 20 '16 at 09:54

Input

$ cat file
a,x
a,y
a,z
a,w
b,x
b,y
a,x
b,x

Output

$ awk  'BEGIN{FS=OFS=","}!(($1,$2) in b){b[$1,$2]; a[$1]++}END{for(i in a)print i,a[i]}' file
a,4
b,2

Readable version

awk  'BEGIN{
              FS=OFS=","        # Set input and output separator
           }
!(($1,$2) in b){                # check index col1,col2 exists in array b
              b[$1,$2]          # if not exists then its unique combination
              a[$1]++           # set array b with index col1,col2 and increment count of array a
           }
        END{                    # finally loop through array a and print contents
              for(i in a)
                    print i,a[i]
           }' file

awk. find unique values count for every element in other column

2 Answers2