Як повідомляють дослідники, базою для розробки нового сервісу стали 5,2 мільйона книг, написаних англійською, французькою, іспанською, німецькою, китайською та російською мовами та виданих починаючи з 1500 до 2008 року. Це приблизно третина всієї електронної бібліотеки Google і близько 4% з коли-небудь опублікованих книг. Вчені склали підбірку всіх використаних у цих виданнях слів (близько 500 мільярдів) і допрацювали алгоритм аналізу цього матеріалу на основі пошукової системи Google.
Тепер за допомогою Ngram Viewer будь-який бажаючий може з’ясувати популярність різних слів і фраз, які зустрічалися в книгах за останні 500 з лишком років. Інформація буде подана у вигляді графіків, а видання, в яких зустрілося шукане слово, в хронологічному порядку відстежуються безпосередньо по базі книг Google Books. Фрагменти в текстах будуть виділені, як і при традиційному пошуку по цій електронній бібліотеці. Область пошуку можна обмежити певним історичним періодом і конкретним мовою.
Автори та їх колеги вважають, що новий інструмент стане гарною підмогою для серйозних лінгвістичних досліджень. Однак широку інтернет-аудиторію нова «іграшка», як варто було очікувати, теж вельми зацікавила.