# Problem 79. DNA N-Gram Distribution

Solution 1870233

Submitted on 10 Jul 2019 by jo gayong
### Test Suite

Test Status Code Input and Output
1   Pass
s = 'AACTGAACG'; n = 3; hifreq_correct = 'AAC'; assert(isequal(nGramFrequency(s,n),hifreq_correct))

leg = 1 2 3 4 5 6 7 unk = 1×6 cell array {'AAC'} {'ACG'} {'ACT'} {'CTG'} {'GAA'} {'TGA'} j = 1 3 4 6 5 1 2 occ = 2 1 1 1 1 1 ans = 'AAC'

2   Pass
s = 'dynamic routing service'; n = 2; hifreq_correct = 'ic'; assert(isequal(nGramFrequency(s,n),hifreq_correct))

leg = 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 unk = 1×21 cell array Columns 1 through 18 {' r'} {' s'} {'am'} {'c '} {'ce'} {'dy'} {'er'} {'g '} {'ic'} {'in'} {'mi'} {'na'} {'ng'} {'ou'} {'ro'} {'rv'} {'se'} {'ti'} Columns 19 through 21 {'ut'} {'vi'} {'yn'} j = 6 21 12 3 11 9 4 1 15 14 19 18 10 13 8 2 17 7 16 20 9 5 occ = 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 ans = 'ic'

3   Pass
s = 'Your veracity is exceeded by your sagacity.'; n = 5; hifreq_correct = 'acity'; assert(isequal(nGramFrequency(s,n),hifreq_correct))

leg = Columns 1 through 30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Columns 31 through 39 31 32 33 34 35 36 37 38 39 unk = 1×38 cell array Columns 1 through 14 {' by y'} {' exce'} {' is e'} {' saga'} {' vera'} {' your'} {'Your '} {'acity'} {'agaci'} {'by yo'} {'ceede'} {'city '} {'city.'} {'d by '} Columns 15 through 28 {'ded b'} {'ed by'} {'eded '} {'eeded'} {'eraci'} {'excee'} {'gacit'} {'is ex'} {'ity i'} {'our s'} {'our v'} {'r sag'} {'r ver'} {'racit'} Columns 29 through 38 {'s exc'} {'sagac'} {'ty is'} {'ur sa'} {'ur ve'} {'verac'} {'xceed'} {'y is '} {'y you'} {'your '} j = 7 25 33 27 5 34 19 28 8 12 23 31 36 3 22 29 2 20 35 11 18 17 15 16 14 1 10 37 6 38 24 32 26 4 30 9 21 8 13 occ = 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ans = 'acity'

4   Pass
s = 'AGCGAAGGAAGGATCACATTTCTCAGGACAAAGGCATTTCACTAATGGTT'; n = 3; hifreq_correct = 'AGG'; assert(isequal(nGramFrequency(s,n),hifreq_correct))

leg = Columns 1 through 30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Columns 31 through 48 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 unk = 1×32 cell array Columns 1 through 16 {'AAA'} {'AAG'} {'AAT'} {'ACA'} {'ACT'} {'AGC'} {'AGG'} {'ATC'} {'ATG'} {'ATT'} {'CAA'} {'CAC'} {'CAG'} {'CAT'} {'CGA'} {'CTA'} Columns 17 through 32 {'CTC'} {'GAA'} {'GAC'} {'GAT'} {'GCA'} {'GCG'} {'GGA'} {'GGC'} {'GGT'} {'GTT'} {'TAA'} {'TCA'} {'TCT'} {'TGG'} {'TTC'} {'TTT'} j = 6 22 15 18 2 7 23 18 2 7 23 20 8 28 12 4 14 10 32 31 29 17 28 13 7 23 19 4 11 1 2 7 24 21 14 10 32 31 28 12 5 16 27 3 9 30 25 26 occ = 1 3 1 2 1 1 4 1 1 2 1 2 1 2 1 1 1 2 1 1 1 1 3 1 1 1 1 3 1 1 2 2 ans = 'AGG'

5   Pass
s = 'In short, in matters vegetable, animal, and mineral, I am the very model of a modern Major-General.'; n = 2; hifreq_correct = 'er'; assert(isequal(nGramFrequency(s,n),hifreq_correct))

leg = Columns 1 through 30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Columns 31 through 60 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Columns 61 through 90 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 Columns 91 through 98 91 92 93 94 95 96 97 98 unk = 1×69 cell array Columns 1 through 18 {' I'} {' M'} {' a'} {' i'} {' m'} {' o'} {' s'} {' t'} {' v'} {', '} {'-G'} {'Ge'} {'I '} {'In'} {'Ma'} {'a '} {'ab'} {'aj'} Columns 19 through 36 {'al'} {'am'} {'an'} {'at'} {'bl'} {'d '} {'de'} {'e '} {'e,'} {'eg'} {'el'} {'en'} {'er'} {'et'} {'f '} {'ge'} {'he'} {'ho'} Columns 37 through 54 {'im'} {'in'} {'jo'} {'l '} {'l,'} {'l.'} {'le'} {'m '} {'ma'} {'mi'} {'mo'} {'n '} {'nd'} {'ne'} {'ni'} {'od'} {'of'} {'or'} Columns 55 through 69 {'r-'} {'ra'} {'rn'} {'rs'} {'rt'} {'ry'} {'s '} {'sh'} {'t,'} {'ta'} {'te'} {'th'} {'tt'} {'ve'} {'y '} j = 14 48 7 62 36 54 59 63 10 4 38 48 5 45 22 67 65 31 58 61 9 68 28 34 32 64 17 23 43 27 10 3 21 51 37 45 19 41 10 3 21 49 24 5 46 38 50 31 56 19 41 10 1 13 3 20 44 8 66 35 26 9 68 31 60 69 5 47 52 25 29 40 6 53 33 3 16 5 47 52 25 31 57 48 2 15 18 39 54 55 11 12 30 50 31 56 19 42 occ = 1 1 4 1 4 1 1 1 2 4 1 1 1 1 1 1 1 1 3 1 2 1 1 1 2 1 1 1 1 1 5 1 1 1 1 1 1 2 1 1 2 1 1 1 2 1 2 3 1 2 1 2 1 2 1 2 1 1 1 1 1 1 1 1 1 1 1 2 1 ans = 'er'