Как установить юпитер ноутбук windows 10

This section includes instructions on how to get started with Jupyter Notebook.
But there are multiple Jupyter user interfaces one can use, based on their needs.
Please checkout the list and links below for additional information and instructions about
how to get started with each of them.

This information explains how to install the Jupyter Notebook and the IPython
kernel.

Prerequisite: Python#

While Jupyter runs code in many programming languages, Python
is a requirement for installing the Jupyter Notebook. The Python version required
differs between Jupyter Notebook releases (e.g. Python 3.6+ for Notebook v6.3,
and Python 3.7+ for Notebook v7) .

We recommend using the Anaconda
distribution to install Python and Jupyter. We’ll go through its installation
in the next section.

Installing Jupyter using Anaconda and conda#

For new users, we highly recommend installing Anaconda. Anaconda conveniently
installs Python, the Jupyter Notebook, and other commonly used packages for
scientific computing and data science.

Use the following installation steps:

  1. Download Anaconda. We recommend
    downloading Anaconda’s latest Python 3 version (currently Python 3.9).

  2. Install the version of Anaconda which you downloaded, following the
    instructions on the download page.

  3. Congratulations, you have installed Jupyter Notebook. To run the notebook:

    See Running the Notebook for more details.

Alternative for experienced Python users: Installing Jupyter with pip#

Important

Jupyter installation requires Python 3.3 or greater, or
Python 2.7. IPython 1.x, which included the parts that later became Jupyter,
was the last version to support Python 3.2 and 2.6.

As an existing Python user, you may wish to install Jupyter using Python’s
package manager, pip, instead of Anaconda.

First, ensure that you have the latest pip;
older versions may have trouble with some dependencies:

pip3 install --upgrade pip

Then install the Jupyter Notebook using:

(Use pip if using legacy Python 2.)

Congratulations. You have installed Jupyter Notebook. See
Running the Notebook for more details.

Jupyter Notebook is an open-source web application that allows you to create and share documents that contain live code, equations, visualizations, and narrative text. Uses include data cleaning and transformation, numerical simulation, statistical modeling, data visualization, machine learning, and much more.

Jupyter has support for over 40 different programming languages and Python is one of them. Python is a requirement (Python 3.3 or greater, or Python 2.7) for installing the Jupyter Notebook itself.

Jupyter Notebook can be installed by using either of the two ways described below:

  • Using Anaconda:
    Install Python and Jupyter using the Anaconda Distribution, which includes Python, the Jupyter Notebook, and other commonly used packages for scientific computing and data science. To install Anaconda, go through How to install Anaconda on windows? and follow the instructions provided.
  • Using PIP:
    Install Jupyter using the PIP package manager used to install and manage software packages/libraries written in Python. To install pip, go through How to install PIP on Windows? and follow the instructions provided.

Installing Jupyter Notebook using Anaconda:

Anaconda is an open-source software that contains Jupyter, spyder, etc that are used for large data processing, data analytics, heavy scientific computing. Anaconda works for R and python programming language. Spyder(sub-application of Anaconda) is used for python. Opencv for python will work in spyder. Package versions are managed by the package management system called conda.

To install Jupyter using Anaconda, just go through the following instructions:

Launching Jupyter:
Launching-Jupyter-Notebook

Jupyter-Launch-Window

Installing Jupyter Notebook using pip:

PIP is a package management system used to install and manage software packages/libraries written in Python. These files are stored in a large “on-line repository” termed as Python Package Index (PyPI).
pip uses PyPI as the default source for packages and their dependencies.

To install Jupyter using pip, we need to first check if pip is updated in our system. Use the following command to update pip:

python -m pip install --upgrade pip

Updating-pip-version

After updating the pip version, follow the instructions provided below to install Jupyter:

  • Command to install Jupyter:
    python -m pip install jupyter
    
  • Beginning Installation:
    Beginning-installation
  • Downloading Files and Data:
    Downloading-data-and-files
  • Installing Packages:
    Installing-packages
  • Finished Installation:
    Finished-Installation
  • Launching Jupyter:
    Use the following command to launch Jupyter using command-line:

    jupyter notebook

    Using-Launch-command-Code

    Jupyter-Launch-Window

Last Updated :
05 Oct, 2021

Like Article

Save Article

Все курсы > Программирование на Питоне > Занятие 14

jupyter notebook

Программа Jupyter Notebook — это локальная программа, которая открывается в браузере и позволяет интерактивно исполнять код на Питоне, записанный в последовательности ячеек.

интерфейс jupyter notebook

Облачной версией Jupyter Notobook является программа Google Colab, которой мы уже давно пользуемся на курсах машинного обучения. Если вы проходили мои занятия, то в работе с этой программой для вас не будет почти ничего нового.

Способ 1. Если на вашем компьютере уже установлен Питон, то установить Jupyter Notebook можно через менеджер пакетов pip.

Способ 2 (рекомендуется). Кроме того, Jupyter Notebook входит в дистрибутив Питона под названием Anaconda.

На сегодняшнем занятии мы рассмотрим именно второй вариант установки.

Anaconda

Anaconda — это дистрибутив Питона и репозиторий пакетов, специально предназначенных для анализа данных и машинного обучения.

дистрибутив и репозиторий Anaconda

Основу дистрибутива Anaconda составляет система управления пакетами и окружениями conda.

Conda можно управлять двумя способами, а именно через Anaconda Prompt — программу, аналогичную командной строке Windows, или через Anaconda Navigator — понятный графический интерфейс.

Кроме того, в дистрибутив Anaconda входит несколько полезных программ:

  • Jupyter Notebook и JupyterLab — это программы, позволяющие исполнять код на Питоне (и, как мы увидим, на других языках) и обрабатывать данные.
  • Spyder и PyCharm представляют собой так называемую интегрированную среду разработки (Integrated Development Environment, IDE). IDE — это редактор кода наподобие программы Atom или Sublime Text с дополнительными возможностями автодополнения, компиляции и интерпретации, анализа ошибок, отладки (debugging), подключения к базам данных и др.
  • RStudio — интегрированная среда разработки для программирования на R.

На схеме структура Anaconda выглядит следующим образом:

компоненты Anaconda

Установка дистрибутива Anaconda на Windows

Шаг 1. Скачайте Anaconda⧉ с официального сайта.

Шаг 2. Запустите установщик.

На одном из шагов установки вам предложат поставить две галочки, в частности (1) добавить Anaconda в переменную path и (2) сделать дистрибутив Anaconda версией, которую Windows обнаруживает по умолчанию.

установка дистрибутива Anaconda

Не отмечайте ни один из пунктов!

Так вы сможете использовать два дистрибутива Питона, первый дистрибутив мы установили на прошлом занятии, второй — сейчас.

Как запустить Jupyter Notebook

После того как вы скачали и установили Anaconda, можно переходить к запуску ноутбука.

Шаг 1. Откройте Anaconda Navidator

Открыть Anaconda Navigator можно двумя способами.

Способ 1. Запуск из меню «Пуск». Просто перейдите в меню «Пуск» и выберите Anaconda Navigator.

как открыть Anaconda Navigator

Способ 2. Запуск через Anaconda Prompt. Также из меню «Пуск» откройте терминал Anaconda Prompt.

как открыть Anaconda Navigator через Anaconda Prompt

Введите команду
anaconda-navigator.

команда anaconda-navigator в Anaconda Prompt

В результате должно появиться вот такое окно.

интерфейс Anaconda Navigator

Шаг 2. Откройте Jupyter Notebook

Теперь выберите Jupyter Notebook и нажмите Launch («Запустить»).

запуск Jupyter Notebook через Anaconda Navigator

Замечу, что Jupyter Notebook можно открыть не только из Anaconda Navigator, но и через меню «Пуск», а также введя в терминале Anaconda Prompt команду
jupyter-notebook.

В результате должен запуститься локальный сервер, и в браузере откроется перечень папок вашего компьютера.

список директорий при запуске Anaconda Navigator

Шаг 3. Выберите папку и создайте ноутбук

Выберите папку, в которой хотите создать ноутбук. В моем случае я выберу Рабочий стол (Desktop).

Теперь в правом верхнем углу нажмите New → Python 3.

создание Jupyter Notebook с ядром на Питоне

Мы готовы писать и исполнять код точно также, как мы это делаем в Google Colab.

ячейка с кодом Jupyter Notebook

Импортируем библиотеку Numpy и создадим массив.

импорт библиотеки Numpy в Jupyter Notebook

Шаг 4. Сохраните ноутбук и закройте Jupyter Notebook

Переименуйте ноутбук в mynotebook (для этого, как и в Google Colab, отредактируйте само название непосредственно в окне ноутбука). Сохранить файл можно через File → Save and Checkpoint.

сохранение ноутбука

Обратите внимание, помимо файла mynotebook.ipynb, Jupyter Notebook создал скрытую папку .ipynb_checkpoints. В ней хранятся файлы, которые позволяют вернуться к предыдущей сохраненной версии ноутбука (предыдущему check point). Сделать это можно, нажав File → Revert to Checkpoint и выбрав дату и время предыдущей сохраненной версии кода.

Когда вы закончили работу, закройте вкладку с ноутбуком. Остается прервать работу локального сервера, нажав Quit в правом верхнем углу.

остановка локального сервера Jupyter Notebook

Особенности работы

Давайте подробнее поговорим про возможности Jupyter Notebook. Снова запустим только что созданный ноутбук любым удобным способом.

Код на Python

В целом мы пишем обычный код на Питоне.

Вкладка Cell

Для управления запуском или исполнением ячеек можно использовать вкладку Cell.

вкладка Cell программы Jupyter Notebook

Здесь мы можем, в частности:

  • Запускать ячейку и оставаться в ней же через Run Cells
  • Исполнять все ячейки в ноутбуке, выбрав Run All
  • Исполнять все ячейки выше (Run All Above) или ниже текущей (Run All Below)
  • Очистить вывод ячеек, нажав All Output → Clear

Вкладка Kernel

Командами вкладки Kernel мы управляем ядром (kernel) или вычислительным «движком» ноутбука.

вкладка Kernel программы Jupyter Notebook

В этой вкладке мы можем, в частности:

  • Прервать исполнение ячейки командой Interrupt. Это бывает полезно, если, например, исполнение кода занимает слишком много времени или в коде есть ошибка и исполнение кода не прервется самостоятельно.
  • Перезапустить kernel можно командой Restart. Кроме того, можно
    • очистить вывод (Restart & Clear Output) и
    • заново запустить все ячейки (Restart & Run All)

Несколько слов про то, что такое ядро и как в целом функционирует Jupyter Notebook.

схема Jupyter Notebook: пользователь, браузер, сервер, ядро, файл

Пользователь взаимодействует с ноутбуком через браузер. Браузер в свою очередь отправляет запросы на сервер. Функция сервера заключается в том, чтобы загружать ноутбук и сохранять внесенные изменения в формате JSON с расширением .ipynb. Одновременно, сервер обращается к ядру в тот момент, когда необходимо обработать код на каком-либо языке (например, на Питоне).

Такое «разделение труда» между браузером, сервером и ядром позволяет во-первых, запускать Jupyter Notebook в любой операционной системе, во-вторых, в одной программе исполнять код на нескольких языках, и в-третьих, сохранять результат в файлах одного и того же формата.

Возможность программирования на нескольких языках (а значит использование нескольких ядер) мы изучим чуть позже, а пока посмотрим как устанавливать новые пакеты для Питона внутри Jupyter Notebook.

Установка новых пакетов

Установить новые пакеты в Anaconda можно непосредственно в ячейке, введя
!pip install <package_name>. Например, попробуем установить Numpy.

установка пакетов внутри Jupyter Notebook

Система сообщила нам, что такой пакет уже установлен. Более того, мы видим путь к папке внутри дистрибутива Anaconda, в которой Jupyter «нашел» Numpy.

При подготовке этого занятия я использовал два компьютера, поэтому имя пользователя на скриншотах указано как user или dmvma. На вашем компьютере при указании пути к файлу используйте ваше имя пользователя.

В последующих разделах мы рассмотрим дополнительные возможности по установке пакетов через Anaconda Prompt и Anaconda Navigator.

По ссылке ниже вы можете скачать код, который мы создали в Jupyter Notebook.

Два Питона на одном компьютере

Обращу ваше внимание, что на данный момент на моем компьютере (как и у вас, если вы проделали шаги прошлого занятия) установлено два Питона, один с сайта www.python.org⧉, второй — в составе дистрибутива Anaconda.

Посмотреть на установленные на компьютеры «Питоны» можно, набрав команду
where python в Anaconda Prompt.

команда where python в Anaconda Prompt

Указав полный или абсолютный путь (absolute path) к каждому из файлов python.exe, мы можем в интерактивном режиме исполнять код на версии 3.8 (установили с www.python.org) и на версии 3.10 (установили в составе Anaconda). При запуске файла python.exe из папки WindowsApps система предложит установить Питон из Microsoft Store.

В этом смысле нужно быть аккуратным и понимать, какой именно Питон вы используете и куда устанавливаете очередной пакет.

В нашем случае мы настроили работу так, чтобы устанавливать библиотеки для Питона с www.python.org через командную строку Windows, и устанавливать пакеты в Анаконду через Anaconda Prompt.

Убедиться в этом можно, проверив версии Питона через
python —version в обеих программах.

команда python --version в командной строке Windows и Anaconda Prompt

Теперь попробуйте ввести в них команду
pip list и сравнить установленные библиотеки.

Markdown в Jupyter Notebook

Вернемся к Jupyter Notebook. Помимо ячеек с кодом, можно использовать текстовые ячейки, в которых поддерживается язык разметки Markdown. Мы уже коротко рассмотрели этот язык на прошлом занятии, когда создавали пакет на Питоне.

По большому счету, с помощью несложных команд Markdown, вы говорите Jupyter как отформатировать ту или иную часть текста.

Рассмотрим несколько основных возможностей форматирования (для удобстства и в силу практически полного совпадения два последующих раздела приведены в ноутбуке Google Colab).

Откроем ноутбук к этому занятию⧉

Заголовки

Заголовки создаются с помощью символа решетки.

# Заголовок 1

## Заголовок 2

### Заголовок 3

#### Заголовок 4

##### Заголовок 5

###### Заголовок 6

заголовки в markdown

Если перед первым символом решетки поставить знак \, Markdown просто выведет символы решетки.

символ "\" перед символом решетки в markdown

Абзацы

Абзацы отделяются друг от друга пробелами.

абзацы в markdown

Мы также можем разделять абзацы прямой линией.

горизонтальная линия в markdown

Выделение текста

**Полужирный стиль**

*Курсив*

~~Перечеркнутый стиль~~

выделение текста в markdown

Форматирование кода и выделенные абзацы

Мы можем выделять код внутри строки или отдельным абзацем.

Отформатируем код `print(‘Hello world!’)` внутри строки и отдельным абзацем

«`

print(‘Hello world!’)

«`

форматирование кода в markdown

Возможно выделение и текстовых абзацев ( так называемые blockquotes).

> Markdown позволяет форматировать текст без использования тэгов.

>

> Он был создан в 2004 году Джоном Грубером и Аароном Шварцем.

выделенный абзац в markdown

Списки

Посмотрим на создание упорядоченных и неупорядоченных списков.

**Упорядоченный список**

1. Пункт 1

1. Пункт 2 (нумерация ведется автоматически)

**Неупорядоченный список**

* Пункт 1.1

  * Пункт 2.1

  * Пункт 2.2

    * Пункт 3.1

    * Пункт 3.2

* Пункт 1.2

упорядоченные и неупорядоченные списки в markdown

Ссылки и изображения

Текст ссылки заключается в квадратные скобки, сама ссылка — в круглые.

[сайт проекта Jupyter](https://jupyter.org/)

ссылка в markdown

Изображение форматируется похожим образом.

![логотипы Jupyter и Python](https://www.dmitrymakarov.ru/wp-content/uploads/2022/05/jupyter-python.jpeg)

логотип Jupyter Notebook и Python

Таблицы

| id | item     | price |

|— |———-| ——|

| 01 | pen      | 200   |

| 02 | pencil   | 150   |

| 03 | notebook | 300   |

таблица в markdown

Таблицы для Markdown бывает удобно создавать с помощью специального инструмента⧉.

Формулы на LaTeX

В текстовых полях можно вставлять формулы и математические символы с помощью системы верстки, которая называется LaTeX (произносится «латэк»). Они заключаются в одинарные или двойные символы $.

Если использовать одинарный символ $, то расположенная внутри формула останется в пределах того же абзаца. Например, запись
$ y = x^2 $ даст $ y = x^2 $.

В то время как
$$ y = x^2 $$ поместит формулу в новый абзац.

$$ y = x^2 $$

Одинарный символ \ добавляет пробел. Двойной символ \\ переводит текст на новую строку.

$$ \hat{y} = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + \ \ ... \ \ + \\ \theta_n x_n $$

символы \ (пробел) и \\ (перенос строки) в LaTeX

Рассмотрим некоторые элементы синтаксиса LaTeX.

Форматирование текста

$ \text{just text} $

$ \textbf{bold} $

$ \textit{italic} $

$ \underline{undeline} $

форматирование текста в LaTeX

Надстрочные и подстрочные знаки

hat $ \hat{x} $

bar $ \bar{x} $

vector $ \vec{x} $

tilde $ \tilde{x} $

superscript $ e^{ax + b} $

subscript $ A_{i, j} $

degree $ 90^{\circ} $

надстрочные и подстрочные знаки в LaTeX

Скобки

Вначале рассмотрим код для скобок в пределах высоты строки.

$$

(a+b) \\

[a+b] \\

\{a+b\} \\

\langle x+y \rangle \\

|x+y| \\

\|x+y\|

$$

скобки в пределах высоты строки в LaTeX

Кроме того, с помощью
\left(,
\right), а также
\left[,
\right] и так далее можно увеличить высоту скобки. Сравните.

$$

\left(\frac{1}{2}\right) \qquad (\frac{1}{2})

$$

круглые скобки с увеличенной высотой в LaTeX

Также можно использовать отдельные команды для скобок различного размера.

$$

\big( \Big( \bigg( \Bigg( \\

\big] \Big] \bigg] \Bigg] \\

\big\{ \Big\{ \bigg\{ \Bigg\{

$$

скобки различного размера в LaTeX

Дробь и квадратный корень

fraction

$$ \frac{1}{1+e^{z}} $$

square root $ \sqrt{\sigma^2} $

дробь и квадратный корень в LaTeX

Греческие буквы

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

|Uppercase  | LaTeX     |Lowercase     | LaTeX       | RU       |

|  |    |     |      |  |

|  |    |$\alpha$      |\\alpha      | альфа    |

|  |    |$\beta$       |\\beta       | бета     |

|$\Gamma$   |\\Gamma    |$\gamma$      |\\gamma      | гамма    |

|$\Delta$   |\\Delta    |$\delta$      |\\delta      | дельта   |

|  |    |$\epsilon$    |\\epsilon    | эпсилон  |

|  |    |$\varepsilon$ |\\varepsilon |   |

|  |    |$\zeta$       |\\zeta       | дзета    |

|  |    |$\eta$        |\\eta        | эта      |

|$\Theta$   |\\Theta    |$\theta$      |\\theta      | тета     |

|  |    |$\vartheta$   |\\vartheta   |   |

|  |    |$\iota$       |\\iota       | йота     |

|  |    |$\kappa$      |\\kappa      | каппа    |

|$\Lambda$  |\\Lambda   |$\lambda$     |\\lambda     | лямбда   |

|  |    |$\mu$         |\\mu         | мю       |

|  |    |$\nu$         |\\nu         | ню       |

|$\Xi$      |\\Xi       |$\xi$         |\\xi         | кси      |

|  |    |$\omicron$    |\\omicron    | омикрон  |

|$\Pi$      |\\Pi       |$\pi$         |\\pi         | пи       |

|  |    |$\varpi$      |\\varpi      |   |

|  |    |$\rho$        |\\rho        | ро       |

|  |    |$\varrho$     |\\varrho     |   |

|$\Sigma$   |\\Sigma    |$\sigma$      |\\sigma      | сигма    |

|  |    |$\varsigma$   |\\varsigma   |   |

|  |    |$\tau$        |\\tau        | тау      |

|$\Upsilon$ |\\Upsilon  |$\upsilon$    |\\upsilon    | ипсилон  |

|$\Phi$     |\\Phi      |$\phi$        |\\phi        | фи       |

|  |    |$\varphi$     |\\varphi     |   |

|  |    |$\chi$        |\\chi        | хи       |

|$\Psi$     |\\Psi      |$\psi$        |\\psi        | пси      |

|$\Omega$   |\\Omega    |$\omega$      |\\omega      | омега    |

греческий алфавит в LaTeX

греческий алфавит в LaTeX 2

Латинские обозначения

$$

\sin(\alpha) = \sin(\alpha) \\

\cos(\theta)=\sin \left( \frac{\pi}{2}\theta \right) \\

\tan(x) = \frac{\sin(x)}{\cos(x)} \\

\log_b(1) = 0 \\

$$

латинские обозначения в LaTeX

Логические символы и символы множества

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

| LaTeX                  |  symbol                   |

| | |

|\Rightarrow             | $ \Rightarrow $           |

|\rightarrow             | $ \rightarrow $           |

|\longleftrightarrow     | $ \Leftrightarrow $       |

|\cap                    | $ \cap $                  |

|\cup                    | $ \cup $                  |

|\subset                 | $ \subset $               |

|\in                     | $ \in $                   |

|\notin                  | $ \notin $                |

|\varnothing             | $ \varnothing $           |

|\neg                    | $ \neg $                  |

|\forall                 | $ \forall $               |

|\exists                 | $ \exists $               |

|\mathbb{N}              | $ \mathbb{N} $            |

|\mathbb{Z}              | $ \mathbb{Z} $            |

|\mathbb{Q}              | $ \mathbb{Q} $            |

|\mathbb{R}              | $ \mathbb{R} $            |

|\mathbb{C}              | $ \mathbb{C} $            |

логические символы и символы множества в LaTeX

Другие символы

| LaTeX                  |  symbol                   |

| | |

| <                      | $ < $                     |

| \leq                   | $ \leq $                  |

| >                      | $ \geq $                  |

| \neq                   | $ \neq $                  |

| \approx                | $ \approx $               |

| \angle                 | $ \angle $                |

| \parallel              | $ \parallel $             |

| \pm                    | $ \pm $                   |

| \mp                    | $ \mp $                   |

| \cdot                  | $ \cdot $                 |

| \times                 | $ \times $                |

| \div                   | $ \div $                  |

другие символы в LaTeX

Кусочная функция и система уравнений

Посмотрим на запись функции sgn (sign function) средствами LaTeX.

$$

sgn(x) = \left\{

    \begin{array}\\

        1 & \mbox{if } \ x \in \mathbf{N}^* \\

        0 & \mbox{if } \ x = 0 \\

        1 & \mbox{else.}

    \end{array}

\right.

$$

функция sgn в LaTeX

Схожим образом записывается система линейных уравнений.

$$

\left\{

    \begin{matrix}

    4x  + 3y = 20 \\

    5x + 9y = 26

    \end{matrix}

\right.

$$

система линейных уравнений в LaTeX

Горизонтальная фигурная скобка

$$

\overbrace{

  \underbrace{a}_{real} +

  \underbrace{b}_{imaginary} i}

  ^{\textit{complex number}}

$$

горизонтальная фигурная скобка в LaTeX

Предел, производная, интеграл

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

Пределы:

$$ \lim_{x \to +\infty} f(x) $$

$$ \lim_{x \to \infty} f(x) $$

$$ \lim_{x \to с} f(x) $$

Производная (нотация Лагранжа):

$$ f(x) $$

Частная производная (нотация Лейбница):

$$ \frac{\partial f}{\partial x} $$

Градиент:

$$

\nabla f(x_1, x_2) = 

\begin{bmatrix}

\frac{\partial f}{\partial x_1} \\ \frac{\partial f}{\partial x_2} 

\end{bmatrix}

$$

Интеграл:

$$\int_{a}^b f(x)dx$$

пределы, производная, интеграл в LaTeX

Сумма и произведение

Сумма:

$$ \sum\limits_{i=1}^n a_{i} $$

$$\sum_{i=1}^n a_{i} $$

Произведение:

$$\prod_{j=1}^m a_{j}$$

сумма и произведение в LaTeX

Матрица

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

Без скобок (plain):

$$

\begin{matrix}

1 & 2 & 3\\

a & b & c

\end{matrix}

$$

Круглые скобки (parentheses, round brackets):

$$

\begin{pmatrix}

1 & 2 & 3\\

a & b & c

\end{pmatrix}

$$

Квадратные скобки (square brackets):

$$

\begin{bmatrix}

1 & 2 & 3\\

a & b & c

\end{bmatrix}

$$

Фигурные скобки (curly brackets, braces):

$$

\begin{Bmatrix}

1 & 2 & 3\\

a & b & c

\end{Bmatrix}

$$

Прямые скобки (pipes):

$$

\begin{vmatrix}

1 & 2 & 3\\

a & b & c

\end{vmatrix}

$$

Двойные прямые скобки (double pipes):

$$

\begin{Vmatrix}

1 & 2 & 3\\

a & b & c

\end{Vmatrix}

$$

матрица в LaTeX

Программирование на R

Jupyter Notebook позволяет писать код на других языках программирования, не только на Питоне. Попробуем написать и исполнить код на R, языке, который специально разрабатывался для data science.

Вначале нам понадобится установить kernel для R. Откроем Anaconda Prompt и введем следующую команду
conda install -c r r-irkernel. В процессе установки система спросит продолжать или нет (Proceed ([y]/n)?). Нажмите y + Enter.

Откройте Jupyter Notebook. В списке файлов создайте ноутбук на R. Назовем его rprogramming.

создание Jupyter Notebook с ядром на R

После установки нового ядра и создания еще одного файла .ipynb схема работы нашего Jupyter Notebook немного изменилась.

схема Jupyter Notebook: пользователь, браузер, сервер, ядра (Python и R), файлы

Теперь мы готовы писать код на R. Мы уже начали знакомиться с этим языком, когда изучали парадигмы программирования. Сегодня мы рассмотрим основные типы данных и особенности синтаксиса.

Переменные в R

Числовые, строковые и логические переменные

Как и в Питоне, в R мы можем создавать числовые (numeric), строковые (character) и логические (logical) переменные.

# поместим число 42 в переменную numeric_var

numeric_var = 42

# строку поместим в переменную text_var

text_var < ‘Hello world!’

# наконец присвоим значение TRUE переменной logical_var

TRUE -> logical_var

Для присвоения значений можно использовать как оператор
=, так и операторы присваивания
< и
->. Обратите внимание, используя
-> мы можем поместить значение слева, а переменную справа.

Посмотрим на результат (в Jupyter Notebook можно обойтись без функции print()).

Выведем класс созданных нами объектов с помощью функции class().

class(numeric_var)

class(text_var)

class(logical_var)

‘numeric’

‘character’

‘logical’

Тип данных можно посмотреть с помощью функции typeof().

typeof(numeric_var)

typeof(text_var)

typeof(logical_var)

‘double’

‘character’

‘logical’

Хотя вывод этих функций очень похож, мы, тем не менее, видим, что классу numeric соответствует тип данных double (число с плавающей точкой с двумя знаками после запятой).

Числовые переменные: numeric, double, integer

По умолчанию, в R и целые числа, и дроби хранятся в формате double.

# еще раз поместим число 42 в переменную numeric_var

numeric_var < 42

# выведем тип данных

typeof(numeric_var)

Принудительно перевести 42 в целочисленное значение можно с помощью функции as.integer().

int_var < as.integer(numeric_var)

typeof(int_var)

Кроме того, если после числа поставить L, это число автоматически превратится в integer.

Превратить integer обратно в double можно с помощью функций as.double() и as.numeric().

typeof(as.double(int_var))

typeof(as.numeric(42L))

Если число хранится в формате строки, его можно перевести обратно в число (integer или double).

text_var < ’42’

typeof(text_var)

typeof(as.numeric(text_var)) # можно также использовать as.double()

typeof(as.integer(text_var))

Вектор

Вектор (vector) — это одномерная структура, которая может содержать множество элементов одного типа. Вектор можно создать с помощью функции c().

# создадим вектор с информацией о продажах товара в магазине за неделю (в тыс. рублей)

sales < c(24, 28, 32, 25, 30, 31, 29)

sales

С помощью функций length() и typeof() мы можем посмотреть соответственно общее количество элементов и тип данных каждого из них.

# посмотрим на общее количество элементов и тип данных каждого из них

length(sales)

typeof(sales)

У вектора есть индекс, который (в отличие, например, от списков в Питоне), начинается с единицы.

При указании диапазона выводятся и первый, и последний его элементы.

Отрицательный индекс убирает элементы из вектора.

Именованный вектор (named vector) создается с помощью функции names().

# создадим еще один вектор с названиями дней недели

days_vector < c(‘Понедельник’, ‘Вторник’, ‘Среда’, ‘Четверг’, ‘Пятница’, ‘Суббота’, ‘Воскресенье’)

days_vector

‘Понедельник’ ‘Вторник’ ‘Среда’ ‘Четверг’ ‘Пятница’ ‘Суббота’ ‘Воскресенье’

# создадим именованный вектор с помощью функции names()

names(sales) < days_vector

sales

Выводить элементы именованного вектора можно не только по числовому индексу, но и по их названиям.

Список

В отличие от вектора, список (list) может содержать множество элементов различных типов.

# список создается с помощью функции list()

list(‘DS’, ‘ML’, c(21, 24), c(TRUE, FALSE), 42.0)

[[1]]

[1] «DS»

[[2]]

[1] «ML»

[[3]]

[1] 21 24

[[4]]

[1]  TRUE FALSE

[[5]]

[1] 42

Матрица

Матрица (matrix) в R — это двумерная структура, содержащая одинаковый тип данных (чаще всего числовой). Матрица создается с помощью функции matrix() с параметрами data, nrow, ncol и byrow.

  • data — данные для создания матрицы
  • nrow и ncol — количество строк и столбцов
  • byrow — параметр, указывающий заполнять ли элементы матрицы построчно (TRUE) или по столбцам (FALSE)

Рассмотрим несколько примеров. Cоздадим последовательность целых чисел (по сути, тоже вектор).

# для этого подойдет функция seq()

sqn < seq(1:9)

sqn

typeof(sqn)

1 2 3 4 5 6 7 8 9

‘integer’

Используем эту последовательность для создания двух матриц.

# создадим матрицу, заполняя значения построчно

mtx < matrix(sqn, nrow = 3, ncol = 3, byrow = TRUE)

mtx

матрица на R, значения заполнены построчно

# теперь создадим матрицу, заполняя значения по столбцам

mtx < matrix(sqn, nrow = 3, ncol = 3, byrow = FALSE)

mtx

матрица на R, значения заполнены по столбцам

Зададим названия для строк и столбцов второй матрицы.

# создадим два вектора с названиями строк и столбцов

rows < c(‘Row 1’, ‘Row 2’, ‘Row 3’)

cols < c(‘Col 1’, ‘Col 2’, ‘Col 3’)

# используем функции rownames() и colnames(),

# чтобы передать эти названия нашей матрице

rownames(mtx) < rows

colnames(mtx) < cols

# посмотрим на результат

mtx

матрица на R с названиями столбцов и строк

Посмотрим на размерность этой матрицы с помощью функции dim().

Массив

В отличие от матрицы, массив (array) — это многомерная структура. Создадим трехмерный массив размерностью 3 х 2 х 3. Вначале создадим три матрицы размером 3 х 2.

# создадим три матрицы размером 3 х 2,

# заполненные пятерками, шестерками и семерками

a < matrix(5, 3, 2)

b < matrix(6, 3, 2)

c < matrix(7, 3, 2)

Теперь соединим их с помощью функции array(). Передадим этой функции два параметра в форме векторов: данные (data) и размерность (dim).

arr < array(data = c(a, b, c), # вектор с матрицами

             dim = c(3, 2, 3))  # вектор размерности

print(arr)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

, , 1

     [,1] [,2]

[1,]    5    5

[2,]    5    5

[3,]    5    5

, , 2

     [,1] [,2]

[1,]    6    6

[2,]    6    6

[3,]    6    6

, , 3

     [,1] [,2]

[1,]    7    7

[2,]    7    7

[3,]    7    7

Факторная переменная

Факторная переменная или фактор (factor) — специальная структура для хранения категориальных данных. Вначале немного теории.

Как мы узнаем на курсе анализа данных, категориальные данные бывают номинальными и порядковыми. Номинальные категориальные (nominal categorical) данные представлены категориями, в которых нет естественного внутреннего порядка. Например, пол или цвет волос человека, марка автомобиля могут быть отнесены к определенным категориям, но не могут быть упорядочены.

Порядковые категориальные (ordinal categorical) данные наоборот обладают внутренним, свойственным им порядком. К таким данным относятся шкала удовлетворенности потребителей, класс железнодорожного билета, должность или звание, а также любая количественная переменная, разбитая на категории (например, низкий, средний и высокий уровень зарплат).

Посмотрим, как учесть такие данные с помощью R. Начнем с номинальных данных.

# предположим, что мы собрали данные о цветах нескольких автомобилей и поместили их в вектор

color_vector < c(‘blue’, ‘blue’, ‘white’, ‘black’, ‘yellow’, ‘white’, ‘white’)

# преобразуем этот вектор в фактор с помощью функции factor()

factor_color < factor(color_vector)

factor_color

номинальный фактор на R

Как вы видите, функция factor() разбила данные на категории, при этом эти категории остались неупорядоченными. Посмотрим на класс созданного объекта.

Теперь поработаем с порядковыми данными.

# возьмем данные измерений температуры, выраженные категориями

temperature_vector < c(‘High’, ‘Low’, ‘High’,‘Low’, ‘Medium’, ‘High’, ‘Low’)

# создадим фактор

factor_temperature < factor(temperature_vector,

                             # указав параметр order = TRUE

                             order = TRUE,

                             # а также вектор упорядоченных категорий

                             levels = c(‘Low’, ‘Medium’, ‘High’))

# посмотрим на результат

factor_temperature

порядковый фактор на R

Выведем класс созданного объекта.

class(factor_temperature)

Добавлю, что количество элементов в каждой из категорий можно посмотреть с помощью функции summary().

summary(factor_temperature)

количество элементов в каждой из категорий порядкового фактора

Датафрейм

Датафрейм в R выполняет примерно ту же функцию, что и в Питоне. С помощью функции data.frame() создадим простой датафрейм, гда параметрами будут названия столбцов, а аргументами — векторы их значений.

df < data.frame(city = c(‘Москва’, ‘Париж’, ‘Лондон’),

                 population = c(12.7, 2.1, 8.9),

                 country = c(‘Россия’, ‘Франция’, ‘Великобритания’))

df

датафрейм на R

Доступ к элементам датафрейма можно получить по индексам строк и столбцов, которые также начинаются с единицы.

# выведем значения первой строки и первого столбца

df[1, 1]

индекс ячеек датафрейма на R

# выведем всю первую строку

df[1,]

первая строка датафрейма на R

# выведем второй столбец

df[,2]

Получить доступ к столбцам можно и так.

Дополнительные пакеты

Как и в Питоне, в R мы можем установить дополнительные пакеты через Anaconda Prompt. Например, установим пакет ggplot2 для визуализации данных. Для этого введем команду
conda install r-ggplot2.

В целом команда установки пакетов для R следующая:
conda install r-<package_name>.

Продемонстрируем работу с этим пакетом с помощью несложного датасета mtcars.

# импортируем библиотеку datasets

library(datasets)

# загрузим датасет mtcars

data(mtcars)

# выведем его на экран

mtcars

датасет mtcars на R

Примечание. Здесь приведена лишь часть датасета.

Теперь импортируем установленную ранее библиотеку ggplot2.

Построим гистограмму по столбцу mpg (miles per galon, расход в милях на галлон топлива). Для построения гистограммы нам потребуется через «+» объединить две функции:

  • функцию ggplot(), которой мы передадим наши данные и еще одну функцию aes(), от англ. aesthetics, которая свяжет ось x нашего графика и столбец данных mpg, а также
  • функцию geom_histogram() с параметрами bins (количество интервалов) и binwidth (их ширина), которая и будет отвечать за создание гистограммы

# данными будет датасет mtcars, столбцом по оси x — mpg

ggplot(data = mtcars, aes(x = mpg)) +

# типом графика будет гистограмма с 10 интервалами шириной 5 миль на галлон каждый

geom_histogram(bins = 10, binwidth = 5)

гистограмма в R

Примерно также мы можем построить график плотности распределения (density plot). Только теперь мы передадим функции aes() еще один параметр
fill = as.factor(vs), который (предварительно превратив столбец в фактор через as.factor()) позволит разбить данные на две категории по столбцу vs. В этом датасете признак vs указывает на конфигурацию двигателя (расположение цилиндров), v-образное, v-shaped (vs == 0) или рядное, straight (vs == 1).

Кроме того, для непосредственного построения графика мы будем использовать новую функцию geom_density() с параметром alpha, отвечающим за прозрачность заполнения пространства под кривыми.

ggplot(data = mtcars, aes(x = mpg, fill = as.factor(vs))) +

geom_density(alpha = 0.3)

график плотности в R

Дополнительно замечу, что к столбцам датафрейма можно применять множество различных функций, например, рассчитать среднее арифметическое или медиану с помощью несложных для запоминания mean() и median().

mean(mtcars$mpg)

median(mtcars$mpg)

Кроме того, мы можем применить уже знакомую нам функцию summary(), которая для количественного столбца выдаст минимальное и максимальное значения, первый (Q1) и третий (Q2) квартили, а также медиану и среднее значение.

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.

  10.40   15.43   19.20   20.09   22.80   33.90

В файле ниже содержится созданный нами код на R.

Вернемся к основной теме занятия.

Подробнее про Anaconda

Conda

Программа conda, как уже было сказано, объединяет в себе систему управления пакетами (как pip) и, кроме того, позволяет создавать окружения.

Идея виртуального окружения (virtual environment) заключается в том, что если в рамках вашего проекта вы, например, используете определенную версию библиотеки Numpy и установка более ранней или более поздней версии приведет к сбоям в работе вашего кода, хорошим решением была бы изоляция нужной версии Numpy, а также всех остальных используемых вами библиотек. Именно для этого и нужно виртуальное окружение.

Рассмотрим, как мы можем устанавливать пакеты и создавать окружения через Anaconda Prompt и через Anaconda Navigator.

Anaconda Prompt

Про пакеты. По аналогии с pip, установленные (в текущем окружении) пакеты можно посмотреть с помощью команды
conda list.

Установить пакет можно с помощью команды
conda install <package_name>. Обновить пакет можно через
conda update <package_name>. Например, снова попробуем установить Numpy. о

установка пакета через Anaconda Prompt

Про окружения. По умолчанию мы работаем в базовом окружении (base environment). Посмотреть, какие в целом установлены окружения можно с помощью команды
conda info —envs.

перечень виртуальных сред в Anaconda Prompt

Как вы видите, пока у нас есть только одно окружение. Давайте создадим еще одно виртуальное окружение и назовем его, например, waterfall.

Введите команду
conda create —name waterfall.

создание новой виртуальной среды в Anaconda Prompt

Введем две команды

  • conda activate waterfall для активации нового окружения
  • conda list для того, чтобы посмотреть установленные в нем пакеты

пакеты, установленные в новой виртуальной среде

Как вы видите, в новом окружении нет ни одного пакета. Введем
conda search seaborn, чтобы посмотреть какие версии этого пакета доступны для скачивания.

доступные для скачивания из репозитория Anaconda версии пакета seaborn

Скачаем этот пакет через
conda install seaborn. Проверим установку с помощью
conda list.

установка пакета seaborn через Anaconda Prompt

Как вы видите, помимо seaborn было установлено множество других необходимых для работы пакета библиотек. Вернуться в базовое окружение можно с помощью команд
conda activate base или
conda deactivate.

Импорт модулей и переменная path

На прошлом занятии мы научились импортировать собственный модуль в командной строке Windows (cmd).

Посмотрим, отличается ли содержимое списка path для двух установленных версий Питона. Для этого в командной строке Windows и в Anaconda Prompt перейдем в интерактивный режим с помощью
python. Затем введем

содержимое переменной path в двух дистрибутивах Питона (python.org и Anaconda)

Как мы видим, пути в переменной path будут отличаться и это нужно учитывать, если мы хотим локально запускать собственные модули.

Anaconda Navigator

Запускать программы, управлять окружениями и устанавливать необходимые библиотеки можно также через Anaconda Nagivator. На вкладке Home вы видите программы, которые можно открыть (launch) или установить (install) для текущего окружения.

Anaconda Navigator: вкладка Home

На вкладке Environments отображаются созданные нами окружения (в частности, окружение waterfall, которое мы создали ранее) и содержащиеся в них пакеты.

Anaconda Navigator: вкладка Environments

В целом интерфейс интуитивно понятен, и так как мы уже познакомились с принципом создания окружений и установки в них дополнительных пакетов, уверен, работа с Anaconda Navigator сложностей не вызовет.

Прежде чем завершить, обратимся к еще одной программе для интерактивного программирования JupyterLab.

JupyterLab

JupyterLab — расширенная версия Jupyter Notebook, которая также входит в дистрибутив Anaconda. Запустить эту программу можно через Anaconda Navigator или введя команду
jupyter lab в Anaconda Prompt.

После запуска вы увидите вкладку Launcher, в которой можно создать новый ноутбук (Notebook) на Питоне или R, открыть консоль (Console) на этих языках, а также создать файлы в различных форматах (Other). Слева вы видите список папок компьютера.

JupyterLab: вкладка Launcher

В разделе Console нажмем на Python 3 (ipykernel). Введем несложный код (см. ниже) и исполним его, нажимая Shift + Enter.

консоль на Python в JupyterLab

Как вы видите, здесь мы можем писать код на Питоне так же, как мы это делали в командной строке Windows на прошлом занятии. Закроем консоль.

В файловой системе слева мы можем открывать уже созданные ноутбуки. Например, откроем ноутбук на R rprogramming.ipynb.

ноутбук на R в JupyterLab

В левом меню на второй сверху вкладке мы видим открытые горизонтальные вкладки (Launcher и rprogramming.ipynb), а также запущенные ядра (kernels).

открытые ноутбуки и запущенные ядра в JupyterLab

Консольные ядра (Console 1 и Console 2) можно открыть (по сути, мы снова запустим консоль).

консоль на R в JupyterLab

Две оставшиеся вертикальные вкладки открывают доступ к автоматическому оглавлению (content) и расширениям (extensions).

автоматическое оглавление в JupyterLab

расширения в JupyterLab

Вкладки Run и Kernel в верхнем меню JupyterLab в целом аналогичны вкладкам Cell и Kernel в JupyterNotebook.

Подведем итог

На сегодняшнем занятии мы познакомились с программой Jupyter Notebook, а также изучили дистрибутив Anaconda, в состав которого входит эта программа.

Говоря о программе Jupyter Notebook, мы узнали про возможности работы с ячейками и ядром программы. Кроме того, мы познакомились с языком разметки Markdown и написанием формул с помощью языка верстки LaTeX.

После этого мы установили ядро для программирования на R и рассмотрели основы этого языка.

При изучении дистрибутива Anaconda мы позникомились с системой conda и попрактиковались в установке библиотек и создании окружений через Anaconda Prompt и Anaconda Navigator.

Наконец мы узнали про особенности программы JupyterLab.

Вопросы для закрепления

Вопрос. Что такое Anaconda?

Посмотреть правильный ответ

Ответ: Anaconda — это дистрибутив Питона (с репозиторием пакетов) и отдельной программой управления окружениями и пакетами conda. Пользователь может взаимодействовать с этой программой через терминал (Anaconda Prompt) и графический интерфейс (Anaconda Navigator).

Помимо этого, в дистрибутив Anaconda входят, среди прочих, программы Jupyter Notebook и JupyterLab.

Вопрос. Какой тип ячеек доступен в Jupyter Notebook?

Посмотреть правильный ответ

Ответ: в Jupyter Notebook есть два основных типа ячеек — ячейки для написания кода (в частности, на Питоне и R) и текстовые ячейки, поддерживающие Markdown и LaTeX.

Вопрос. Для чего нужно виртуальное окружение?

Посмотреть правильный ответ

Ответ: виртуальное окружение (virtual environment) позволяет установить и изолировать определенные версии Питона и его пакетов. Таким образом код, написанный с учетом конкретной версии Питона и дополнительных библиотек, исполнится без ошибок.


Ответы на вопросы

Вопрос. Можно ли исполнить код на R в Google Colab?

Ответ. Да, это возможно. Причем двумя способами.

Способ 1. Откройте ноутбук. Введите и исполните команду
%load_ext rpy2.ipython. В последующих ячейках введите
%R, чтобы в этой же строке написать код на R или
%%R, если хотите, чтобы вся ячейка исполнилась как код на R (так называемые магические команды).

В этом случае мы можем исполнять код на двух языках внутри одного ноутбука.

# введем магическую команду, которая позволит программировать на R

%load_ext rpy2.ipython

# команда %%R позволит Colab распознать ячейку как код на R

%%R

# кстати, числовой вектор можно создать просто с помощью двоеточия

x < 1:10

x

# при этом ничто не мешает нам продолжать писать код на Питоне

import numpy as np

np.mean([1, 2, 3])

Приведенный выше код можно найти в дополнительных материалах⧉ к занятию.

Способ 2. Если вы хотите, чтобы весь код исполнялся на R (как мы это делали в Jupyter Notebook), создайте новый ноутбук используя одну из ссылок ниже:

  • https://colab.research.google.com/#create=true&language=r⧉
  • https://colab.to/r⧉

Теперь, если вы зайдете на вкладку Runtime → Change runtime type, то увидите, что можете выбирать между Python и R.

ноутбук на R в Google Colab

Выведем версию R в Google Colab.

‘R version 4.2.0 (2022-04-22)’

Посмотреть на установленные пакеты можно с помощью
installed.packages(). Созданный ноутбук Google Colab на R доступен по ссылке⧉.


Вопрос. Очень медленно загружается Anaconda. Можно ли что-то сделать?

Ответ. Можно работать через Anaconda Prompt, эта программа быстрее графического интерфейса Anaconda Navigator.

Кроме того, можно использовать дистрибутив Miniconda⧉, в который входит conda, Питон и несколько ключевых пакетов. Остальные пакеты устанавливаются вручную по мере необходимости.


Вопрос. Разве Jupyter не должен писаться через i, как Jupiter?

Ответ. Вы правы в том плане, что название Jupyter Notebook происходит не от планеты Юпитер, которая по-английски как раз пишется через i (Jupiter), а представляет собой акроним от названий языков программирования Julia, Python и R.

При этом, как утверждают разработчики⧉, слово Jupyter также отсылает к тетрадям (notebooks) Галилея, в которых он, в частности, документировал наблюдение за лунами Юпитера.


Вопрос. В каких еще программах можно писать код на Питоне и R?

Ответ. Таких программ несколько. Довольно удобно пользоваться облачным решением Kaggle. Там можно создавать как скрипты (scripts, в том числе RMarkdown Scripts), так и ноутбуки на Питоне и R. Подробнее можно почитать в документации⧉ на их сайте.


Вопрос. Можно ли создать виртуальное окружение каким-либо другим способом помимо программы conda?

Ответ. Да, можно. Вот здесь⧉ есть хорошая видео-инструкция.

Вот коротко какие шаги нужно выполнить.

Вначале убедитесь, что у вас уже установлен Питон. В нем по умолчанию содержится модуль venv, который как раз предназначен для создания виртуального окружения.

Шаг 1. Создайте папку с вашим проектом, например, пусть это будет папка webapp для веб-приложения на популярном фреймворке для Питона Django.

папка с проектом веб-приложения

Шаг 2. В командной строке перейдите в папку webapp.

переход в папку с проектом веб-приложения в командной строке

Затем введите команду для создания виртуального окружения.

По сути мы говорим Питону создать окружение djenv (название может быть любым) с помощью модуля venv. Переключатель (flag или switch)
-m подсказывает питону, что venv — это модуль, а не файл.

После выполнения этой команды создается папка djenv виртуального окружения.

папка виртуального окружения

Шаг 3. Активируем это виртуальное окружение следующей командой.

активация виртуального окружения в командной строке

Здесь мы обращаемся к файлу activate внутри папки Scripts. Как вы видите, название окружения появилось слева от пути к папке.

Теперь через pip можно устанавливать пакеты, которые будут «видны» только внутри виртуального окружения djenv.

Шаг 4. Выйти из этого виртуального окружения можно с помощью команды deactivate. Если вам нужно удалить окружение, сначала деактивируйте его, а затем вручную удалите соответствующую папку.

На следующем занятии мы поговорим про такую важную тему, как регулярные выражения.

As a data scientist or software engineer, Jupyter Notebook is an essential tool for your work. Not only does it allow you to organize and document your code, but it also makes it easy to visualize data and collaborate with others. In this article, we’ll guide you through the process of installing and using Jupyter Notebook on Windows 10.

⚠ content generated by AI for experimental purposes only

How to Install and Use Jupyter Notebook on Windows 10

As a data scientist or software engineer, Jupyter Notebook is an essential tool for your work. Not only does it allow you to organize and document your code, but it also makes it easy to visualize data and collaborate with others. In this article, we’ll guide you through the process of installing and using Jupyter Notebook on Windows 10.

What is Jupyter Notebook?

Jupyter Notebook is an open-source web application that allows you to create and share documents that contain live code, equations, visualizations, and narrative text. It supports multiple programming languages, including Python, R, Julia, and more. With Jupyter Notebook, you can create interactive data visualizations, conduct data analysis, and write code in an organized and efficient manner.

Installing Jupyter Notebook on Windows 10

Before we can start using Jupyter Notebook, we need to install it on our Windows 10 machine. Here are the steps to follow:

  1. First, you need to have Python installed on your machine. You can download the latest version of Python from the official website (https://www.python.org/downloads/). Make sure to select the option to add Python to your system PATH during the installation process.

  2. Once Python is installed, open the command prompt by pressing the Windows key + R and typing “cmd” in the Run dialog box.

  3. In the command prompt, type the following command to install Jupyter Notebook:

    ⚠ This code is experimental content and was generated by AI. Please refer to this code as experimental only since we cannot currently guarantee its validity

   pip install jupyter

This will download and install Jupyter Notebook and its dependencies.

  1. After the installation is complete, type the following command to start Jupyter Notebook:

    ⚠ This code is experimental content and was generated by AI. Please refer to this code as experimental only since we cannot currently guarantee its validity

   jupyter notebook

This will open a new tab in your web browser with the Jupyter Notebook interface.

Using Jupyter Notebook on Windows 10

Now that we have Jupyter Notebook installed, let’s take a look at how to use it. When you first open Jupyter Notebook, you’ll see a dashboard with a list of files and folders in your current directory. To create a new notebook, click on the “New” button in the top right corner and select “Python 3” (or any other language you want to use).

Once you’ve created a new notebook, you can start writing code in the cells. To run a cell, press Shift + Enter or click the “Run” button in the toolbar. You can also add text, equations, and visualizations to your notebook using Markdown syntax.

Jupyter Notebook also supports a variety of keyboard shortcuts to make your work more efficient. Here are some of the most useful shortcuts:

  • Shift + Enter: Run the current cell and move to the next one.
  • Ctrl + Enter: Run the current cell.
  • Esc: Enter command mode.
  • Enter: Enter edit mode.
  • A: Insert a new cell above the current cell.
  • B: Insert a new cell below the current cell.
  • D + D: Delete the current cell.
  • M: Change the current cell type to Markdown.
  • Y: Change the current cell type to code.

Conclusion

Jupyter Notebook is a powerful tool for data scientists and software engineers alike. With its ability to create interactive data visualizations, organize and document code, and support multiple programming languages, Jupyter Notebook is an essential part of any data science workflow. By following the steps outlined in this article, you can install and start using Jupyter Notebook on your Windows 10 machine.


About Saturn Cloud

Saturn Cloud is your all-in-one solution for data science & ML development, deployment, and data pipelines in the cloud. Spin up a notebook with 4TB of RAM, add a GPU, connect to a distributed cluster of workers, and more. Join today and get 150 hours of free compute per month.

Featured Image with Sidebar

By Andrei Maksimov

June 3, 2023

Jupyter Notebook is an open-source web application that enables the creation and sharing of documents that contain code, such as Python or R, along with rich text elements like paragraphs, equations, figures, and links. Offering a comprehensive tool for interactive computing, Jupyter Notebook allows users to incorporate text, data visualizations, and code all in one place. This flexibility makes it an ideal data analysis, reporting, and collaborative data-driven storytelling platform widely used in Machine Learning. One of Jupyter Notebook’s key features is its ability to display plots inline as an output of running code cells, enhancing its usability for data analysis tasks.

The power of the Jupyter Notebook extends beyond its analytical capabilities. It also serves as a versatile environment for a variety of tasks. For instance, its integration capabilities with different tools and languages add depth to its functionality. This step-by-step guide will walk you through the installation process of Jupyter Notebook and provide a primer on using it to run Python code interactively. Whether you are a beginner just starting or an experienced coder looking for a robust platform, Jupyter Notebook offers limitless possibilities. Now, let’s get started with installing Jupyter Notebook!

Table of Contents

Prerequisites for Installing Jupyter Notebook

Before diving into the installation process of Jupyter Notebook, let’s look at the prerequisites. Ensuring your system meets the requirements is a crucial first step.

System Requirements

Jupyter Notebook is compatible with three major operating systems: Windows, macOS, and Linux. Here are the minimum system requirements:

  • Operating System: Windows 7 or newer, macOS, or Linux.
  • Memory: At least 1 GB of RAM is recommended for smooth operations.
  • Disk Space: Minimum 1 GB of free disk space for installing and functioning Jupyter Notebook and its dependencies.

Software Requirements

On the software side, you’ll need the following:

  • Python: Jupyter runs on Python, so a working Python environment is required. Python 3.3 or later would be suitable for running Jupyter Notebook. If you don’t have Python installed or have an older version, don’t worry. We’ll guide you through the Python installation process in the next section.
  • PIP package manager: PIP is a package manager for Python. It’s used to install and manage software packages written in Python. If you have Python 2 >=2.7.9 or Python 3 >=3.4 installed from python.org, you will have pip already, else we will guide you on how to get it.

That’s all you need to get started with Jupyter Notebook! It’s also recommended to have a reliable internet connection for a smooth and error-free installation.

In the next sections, we’ll guide you through each step of the installation process, starting with how to install Python. Let’s move forward!

How to Install Python

Python, an essential prerequisite for Jupyter Notebook, is a popular programming language known for its simplicity and readability. Installing Python on your machine is a fairly straightforward process. Here, we’ll guide you on installing Python on three major operating systems: Windows, macOS, and Linux.

Python Installation on Windows

  1. Visit the official Python website’s download page at https://www.python.org/downloads/windows/.
  2. Click on the link that says “Latest Python 3 Release – Python x.x.x” (where x.x.x denotes the latest version).
  3. Scroll to the files section and click “Windows x86-64 executable installer” for 64-bit or “Windows x86 executable installer” for 32-bit systems.
  4. After downloading the installer, run it. In the first installation screen, check the box at the bottom that says “Add Python x.x to PATH”. This will set your system’s PATH for Python.
  5. Click “Install Now”.
  6. Wait for the installation to complete, and then click “Close”.

Python Installation on MacOS

  1. Visit the official Python website’s download page at https://www.python.org/downloads/mac-osx/.
  2. Click on the link “Latest Python 3 Release – Python x.x.x”.
  3. Scroll down to the files section and click “macOS 64-bit Intel installer” or “macOS 64-bit universal2 installer” depending on your system.
  4. After downloading the installer, open it and follow the prompts to install Python.
  5. You can verify the installation by opening Terminal and typing python3 --version. You should see Python’s version number.

Python Installation on Linux

Python is usually preinstalled on most Linux distributions. However, you might want to upgrade to the latest version. Here’s how you can do it:

For Ubuntu, you can use the following commands:

sudo apt update
sudo apt install python3

For CentOS, you can use the following commands:

sudo yum update
sudo yum install python3

Please check the specific documentation for Python installation instructions for other Linux distributions.

You can verify the installation by opening a terminal and typing python3 --version. You should see Python’s version number.

Once you install Python, you are one step closer to getting Jupyter Notebook running on your machine. The next section cover setting up a Python virtual environment, an optional but highly recommended step for managing Python packages.

Setting up a Python Virtual Environment

Python’s Virtual Environment is a self-contained directory tree that includes a Python installation for a particular version of Python, plus several additional packages. It’s a best practice to isolate your Python project’s specific library dependencies in virtual environments, providing a more reliable and controlled development environment.

Let’s walk through the process of setting up a Python virtual environment. This process is the same across all major operating systems.

  1. Install the virtualenv package: Open your command prompt or terminal, and run the following command to install the virtualenv package. This tool lets us create isolated Python environments:
pip install virtualenv
  1. Create a new virtual environment: Navigate to the directory where you want to create your new virtual environment. Once you’re in that directory, run the following command:
virtualenv myenv

Replace myenv with the name, you want to give to your virtual environment. This command creates a new directory containing the virtual environment files with the same name.

  1. Activate the virtual environment: Before we can use the virtual environment, we need to activate it. The command for this varies a bit depending on your operating system:
  • On Windows, run: myenv\Scripts\activate
  • On macOS/Linux, run: source myenv/bin/activate In both commands, replace myenv with the name you gave to your virtual environment.

After you’ve activated your virtual environment, your command prompt will show the name of your virtual environment, something like this: (myenv) C:\path\to\your\directory>. This indicates that the virtual environment is active.

Any Python package installed in the virtual environment is isolated from the global Python environment.

In the next section, we’ll guide you on installing Jupyter Notebook in this isolated environment, ensuring a clean and conflict-free setup. Let’s move on!

Installing Jupyter Notebook using PIP

With your virtual environment set up, you can install Jupyter Notebook. The process is straightforward, thanks to Python’s package manager, PIP.

Ensure your virtual environment is active (you should see the name of your environment in your terminal or command prompt). If it’s inactive, refer to the previous section to activate it.

Once your virtual environment is active, follow these steps:

  1. Install Jupyter Notebook: Run the following command in your terminal:
pip install notebook

This command tells PIP to install the ‘notebook’ package containing the classic Jupyter Notebook application.

  1. Verify the Installation: After the installation completes, you can verify it by running:
jupyter notebook --version

This command would print the installed version of Jupyter Notebook if the installation were successful.

  1. Launch Jupyter Notebook: You can start the Jupyter Notebook interface in your browser by running:
jupyter notebook

This command will print information about the notebook server in your terminal, including the web application URL (by default, http://localhost:8888).

Upon launching, your default browser should automatically open to this URL. You can manually open this URL in your browser if it doesn’t.

You might be interested in installing Jupyter Notebook in the Docker container. Check the How to build Anaconda Python Data Science Docker container for more information on this topic. Also, you might be interested in how to launch Nginx Jupyter Behind A Proxy Setup article, which covers Jupyter Hub installation.

You’ve now installed Jupyter Notebook! You’re ready to start creating and running your notebooks. In the next section, we’ll guide you on running your first Jupyter Notebook, where we’ll include some Python scripting examples.

Let’s continue our journey!

Running Your First Jupyter Notebook

Congratulations on successfully installing Jupyter Notebook! Now, let’s walk through creating and running your first notebook.

  1. Launch Jupyter Notebook: If you’ve closed it, relaunch Jupyter Notebook by running jupyter notebook it in your terminal or command prompt. This command will open the Jupyter Notebook interface in your default web browser.
  2. Create a new Notebook: In the Jupyter Notebook interface, navigate to the right-hand side of the screen and click on the ‘New’ button. Then, select ‘Python 3’ from the dropdown list. A new tab will open with your fresh notebook.
  3. Understanding the Interface: Each Jupyter Notebook is composed of cells. A cell is a multiline text input field, and its contents can be executed by using Shift-Enter, or by clicking either the “Play” button in the toolbar or Cell > Run in the menu bar. The cell’s type determines the execution behavior of a cell. There are three types of cells: code cells, markdown cells, and raw cells. In most cases, you’ll be working with code and markdown cells.
  4. Running Python Code: Click on the first cell and try typing some Python code, such as:
print("Hello, Jupyter!")

Hit ‘Shift + Enter’ to run the cell. The output of the cell will appear below the code.

  1. Writing Markdown Text: You can use Markdown cells to explain your code and findings. Markdown is a lightweight markup language for creating formatted text. To create a Markdown cell, click on a cell, go to the ‘Cell’ menu, select ‘Cell Type’, and then ‘Markdown’. Now, you can write text in this cell. Try typing some text and then run the cell as you did before.
  1. Saving Your Notebook: To save your work, go to ‘File’ and then ‘Save and Checkpoint’, or just hit ‘Ctrl + S’.

You’ve created and run your first Jupyter Notebook. In the following sections, we’ll explore how to troubleshoot the Jupyter Notebook’s common installation issues effectively. Let’s proceed!

Troubleshooting Common Installation Issues

Like any software installation, you may encounter some challenges when installing Python or Jupyter Notebooks. Here are some common issues you might face and solutions to get you past them.

  1. Python not recognized as a command: If you see a ‘Python is not recognized as an internal or external command’ error after installing Python, this likely means that Python was not added to your system’s PATH. To fix this, you can manually add Python to your PATH variable. The method varies between operating systems and versions, so a quick internet search with your specific OS will provide the most accurate steps.
  2. PIP not working: If you’re having trouble using pip, it might be that pip isn’t installed, or it’s an issue with your PATH variable. Python 3 comes with pip preinstalled, so make sure you’re using Python 3. If you still have issues, try reinstalling Python and ensure the ‘pip’ box is checked during installation.
  3. Issues installing Jupyter Notebook: If you’re encountering errors while installing Jupyter Notebook, it might be due to an older version of PIP or Python. Make sure both are up-to-date. You can update pip by running pip install --upgrade pip and update Python by downloading the latest version from the Python website.
  4. Jupyter command not found: If you have installed Jupyter Notebook, but your system can’t seem to find it (i.e., you see a ‘jupyter: command not found’ error), this is likely because the location where pip installed Jupyter is not on your system’s PATH. As mentioned above, you can resolve this by adding the installation location to your PATH.
  5. Issues running Jupyter Notebook: If Jupyter Notebook doesn’t launch automatically, manually launch it by entering the URL in the terminal (usually http://localhost:8888) into your browser’s address bar. If the interface is still not showing up, ensure no firewall or security software is blocking Jupyter Notebook.

Remember, it’s okay to encounter problems during the installation process. It’s part of the learning experience. Don’t hesitate to search online for the errors you’re seeing – it’s likely that others have encountered the same issues and found solutions. Happy troubleshooting!

Best Practices for Using Jupyter Notebook with Python

Utilizing Jupyter Notebook effectively can make your Python programming more efficient and enjoyable. Here are some best practices to ensure you’re getting the most out of your Jupyter Notebook experience:

  1. Organize Your Code with Cells: Jupyter Notebook’s cell structure is its biggest strength. Make good use of it by organizing your code into logical sections. Each cell should accomplish a specific task or represent a specific step in your analysis or modeling process.
  2. Comment Your Code: Like any other programming environment, commenting on your Python code in Jupyter Notebooks is a good habit. Even though you can write rich text in markdown cells, inline comments in your code cells can provide context directly tied to the code.
# Calculate the sum of the list
sum_list = sum(my_list)
  1. Use Markdown Cells for Documentation: Markdown cells are perfect for documenting your analysis process, explaining your reasoning, noting observations, and providing another context. This is what makes Jupyter Notebook great for data storytelling.
  2. Show Your Work: Jupyter Notebook allows you to display your Python data structures in a readable format. This feature shows intermediary steps in your data analysis or modeling process. This can be especially useful for debugging and explaining your process to others.
# Display the content of the list
print(my_list)
  1. Keep Your Notebooks Reproducible: Try to keep your notebooks self-contained and reproducible. If someone else were to run your notebook, they should get the same results. This might involve setting seeds for random number generators, making sure any data files you use are accessible, and providing explicit instructions for any manual steps.
  2. Regularly Save Your Work: Jupyter automatically saves your notebook every few minutes, but you should also get into the habit of manually saving your work. You can do this by clicking ‘File’ > ‘Save and Checkpoint’, or by simply pressing ‘Ctrl + S’.
  3. Clear Your Output: When sharing your notebook, it can be helpful to clear your output data first. This makes the notebook smaller and encourages others to run the code themselves. You can clear output via ‘Cell’ > ‘All Output’ > ‘Clear’.
  4. Use Jupyter Extensions: Jupyter has many extensions that add useful functionality. These can be installed with pip and activated in Jupyter. For instance, the nbextensions_configurator extension provides a convenient way to configure and manage your Jupyter extensions.

Applying these best practices makes your Jupyter Notebook usage more efficient and productive. Happy coding!

FAQ

How do I install a Jupyter Notebook?

To install Jupyter Notebook, you must first install Python on your system. Python comes pre-installed on most UNIX-like systems, including Linux and MacOS. You can download Python from the official website if it’s not installed or using Windows. Once Python is installed, you can install Jupyter Notebook using Python’s package manager, pip. Open your system’s command prompt or terminal and type pip install notebook. Once the installation is complete, you can start Jupyter Notebook by typing jupyter notebook in the terminal. This command will launch the Jupyter Notebook interface in your default web browser, and you’re ready to create and share your interactive documents.

Do I need Python to install Jupyter Notebook?

Python is required to install Jupyter Notebook. Jupyter Notebook is written in Python, and its default kernel runs Python code. Therefore, you must install Python on your system before installing Jupyter Notebook. If Python is not installed, it can be downloaded from the official website. Once Python is installed, Jupyter Notebook can be easily installed using Python’s package manager, pip. It’s important to note that although Jupyter Notebook is Python-based, it can also run code from several other programming languages as long as the appropriate kernels are installed.

How to install Jupyter Notebook using Anaconda Mac?

Installing Jupyter Notebook on a Mac using Anaconda is a straightforward process. First, download the Anaconda installer for Mac from the official Anaconda website. Make sure to download the Python 3.x version. Once the installer is downloaded, open it and follow the on-screen instructions. Anaconda will install Python, Jupyter Notebook, and other useful data science packages. After the installation, you can launch Jupyter Notebook by opening the Anaconda Navigator application, which is installed as part of Anaconda, and then clicking on the Jupyter Notebook icon. Alternatively, you can open a terminal and type jupyter notebook to start Jupyter Notebook. This command will open a new tab in your default web browser with the Jupyter Notebook interface.

How to install Jupyter on Windows Terminal?

First, ensure Python is installed on your Windows system. If not, download it from the official Python website and include Python in the PATH during installation. Next, install Jupyter Notebook via Python’s package manager, pip. To do this, open Windows Terminal (accessed by typing ‘cmd’ in the search bar) and type pip install notebook. After the installation, launch Jupyter Notebook by entering jupyter notebook in the terminal. This command opens the Jupyter Notebook interface in your default web browser, ready for use.

how to install Jupyter Notebook in Windows 10?

To install Jupyter Notebook on Windows 10, you’ll first need to install Python, which can be downloaded from the official Python website. Ensure to check the box to add Python to your PATH during installation. After installing Python, open Command Prompt and type pip install notebook to install Jupyter Notebook using pip, Python’s package manager. After the installation, launch Jupyter Notebook by typing jupyter notebook into the Command Prompt. This command will open the Jupyter Notebook interface in your default web browser, ready for you to create and share interactive documents.

Conclusion

In this comprehensive guide, we’ve covered everything you need to know to install and get started with Jupyter Notebook. Beginning with the fundamentals of Jupyter Notebook, we delved into its prerequisites and guided you through the installation of Python and Jupyter Notebook. We also explored the creation of a Python virtual environment and guided you through running your first Jupyter Notebook.

Additionally, we touched on the collaboration and interactivity features of Jupyter Notebook, showcasing how they can enhance your programming and data analysis tasks. We provided solutions to common installation issues and shared best practices for using Jupyter Notebook with Python, aiming to optimize your Jupyter Notebook experience.

The world of programming is vast and continually evolving. As you advance your journey with Python and Jupyter Notebook, always remember to learn, explore, and experiment, but most importantly, have fun. Happy coding!

References and Additional Resources

To supplement your learning and explore more about Python, and Jupyter Notebook, refer to the following resources:

Python:

  1. Python Official Documentation
  2. Python for Beginners
  3. Learn Python – Full Course for Beginners by FreeCodeCamp

Jupyter Notebook:

  1. Jupyter Notebook Official Documentation
  2. Project Jupyter
  3. Jupyter Notebook Tutorial: Introduction, Setup, and Walkthrough by Corey Schafer

These resources should provide a good starting point for further exploration and mastery. Happy learning!

I’m a passionate Cloud Infrastructure Architect with more than 20 years of experience in IT. In addition to the tech, I’m covering Personal Finance topics at https://amaksimov.com.

Any of my posts represent my personal experience and opinion about the topic.

  • Как установить шейдеры на minecraft windows 10 edition
  • Как установить шрифт по умолчанию в windows 10
  • Как установить шейдеры на майнкрафт bedrock edition windows 10
  • Как установить шрифт на ноутбуке windows 10
  • Как установить шареман на windows 10