SQL для анализа данных SQL

Заметки Дэва

Если вы хотите стать экспертом в области обработки и анализа данных, вам не обойтись без SQL. Язык может использоваться аналитиками и учеными, а также всеми, кто может изучать SQL-запросы в течение нескольких дней.

SQL для анализа данных? Что это? Какая от него польза?

SQL расшифровывается как «язык структурированных запросов».

Однако я предпочитаю другое объяснение. Она расширена с помощью Excel. Вот как выглядит один и тот же набор данных в Excel и SQL.

SQL для анализа данных? Что это? Какая от него польза?

Как видите, SQL и Excel очень похожи. Оба отображают данные в виде двумерных массивов со столбцами и строками. Обе программы хорошо структурированы и просты для понимания.

Однако между ними есть и некоторые различия:

  1. Первое — это производительность. Excel отлично работает с небольшими объемами данных, но при 100 000 строк использование формул может отнимать много времени и быть неэффективным.
  2. Второй — как взаимодействовать с базой данных. Excel — это, по сути, графический интерфейс пользователя (GUI). Это позволяет прокручивать таблицы, вводить формулы и перемещать курсор в нужную область. SQL не имеет графического интерфейса и использует так называемые SQL-запросы.

Изучение SQL-запросов для начинающих показывает, что они гораздо прозрачнее и эффективнее, чем Excel. Кроме того, SQL значительно облегчает автоматизацию задач и использование предыдущей работы.

При анализе данных SQL используется для достаточно простых задач, таких как обобщение наборов данных, объединение, а также простые статистические и математические методы. Однако использование SQL делает вашу работу более эффективной и позволяет работать с большими наборами данных, чем раньше.

ЧИТАТЬ ЕЩЁ:  Работа со службами RESTful в CodeIgniter

Как насчет Python, R или bash?

Как только вы начнете использовать эти языки для анализа данных, вы обнаружите, что Python и R лучше подходят для одного из них, а SQL — для другого. Основные различия между этими языками заключаются в синтаксисе, «функциях» и производительности. Теперь перейдем к практической части!

Шаг 0 — Установите систему управления базами данных SQL

Используйте postgreSQL. Также доступны другие типы SQL. Однако все они похожи, поэтому, как только вы освоите PostgreSQL, адаптация к другому языку займет всего несколько часов (или минут).

На данном этапе вам необходимы три вещи

  1. сервер данных с терминальным или iTerm доступом, и
  2. PostgreSQL, установленный на сервере, и
  3. Pgadmin4 (или SQL Workbench), установленный на компьютере.

Примечание: Используйте SQL Workbench в качестве инструмента SQL.

Шаг 1 — Доступ к базе данных SQL из командной строки

Во-первых, необходимо получить доступ к базе данных из командной строки. В данном разделе объясняется, как это сделать. В дальнейшем вам нужно будет действовать таким же образом.

  1. Откройте терминал (или iTerm).
  2. Подключитесь к серверу через SSH.

В моем случае введите следующее.

Шаг 1 – Зайдите в свою базу данных SQL через командную строку

  1. Подключитесь к серверу для доступа к базе данных postgreSQL. Поскольку я уже предоставил доступ пользователю, я ввожу следующую команду

Где psql — это сама команда, -U означает имя пользователя (в моем случае ‘tomi’), а -d — имя базы данных (в моем случае postgres, как и в вашем). Командная строка изменяется следующим образом

Шаг 1 – Зайдите в свою базу данных SQL через командную строку - 2

Конец! Теперь у вас есть полный доступ к базе данных SQL.

  1. Чтобы проверить SQL-запрос, вы можете ввести

Отобразится список всех таблиц данных. Пока есть только один. Но это скоро изменится: в

ЧИТАТЬ ЕЩЁ:  10 лучших Wordpress-плагинов для создания посадочных страниц

Примечание: Базы данных SQL также называют «реляционными базами данных».

Шаг 2 — Загрузка данных

В этом разделе мы будем использовать небольшой набор данных под названием «зоопарк». Вы можете скачать его в текстовом формате .tsv отсюда.

Оцените статью