GoogleCloudPlatform · MrCsabaToth · Sep 10, 2023 · Sep 10, 2023 · Oct 4, 2023
diff --git a/blogs/textclassification/txtcls.ipynb b/blogs/textclassification/txtcls.ipynb
@@ -188,7 +188,7 @@
     "SELECT\n",
     "  url, title, score\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  LENGTH(title) > 10\n",
     "  AND score > 10\n",
@@ -215,10 +215,10 @@
    "source": [
     "query=\"\"\"\n",
     "SELECT\n",
-    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "  COUNT(title) AS num_articles\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "  AND LENGTH(title) > 10\n",
@@ -408,10 +408,10 @@
     "query=\"\"\"\n",
     "SELECT source, REGEXP_REPLACE(title, '[^a-zA-Z0-9 $.-]', ' ') AS title FROM\n",
     "(SELECT\n",
-    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "  title\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "  AND LENGTH(title) > 10\n",

diff --git a/courses/machine_learning/deepdive/09_sequence/labs/reusable-embeddings.ipynb b/courses/machine_learning/deepdive/09_sequence/labs/reusable-embeddings.ipynb
@@ -126,7 +126,7 @@
     "SELECT\n",
     "    url, title, score\n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    LENGTH(title) > 10\n",
     "    AND score > 10\n",
@@ -150,10 +150,10 @@
     "%%bigquery --project $PROJECT\n",
     "\n",
     "SELECT\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "    COUNT(title) AS num_articles\n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",
@@ -182,10 +182,10 @@
     "sub_query = \"\"\"\n",
     "SELECT\n",
     "    title,\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[OFFSET(1)] AS source\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[SAFE_OFFSET(1)] AS source\n",
     "    \n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '{0}'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",

diff --git a/courses/machine_learning/deepdive/09_sequence/labs/text_classification.ipynb b/courses/machine_learning/deepdive/09_sequence/labs/text_classification.ipynb
@@ -171,7 +171,7 @@
     "SELECT\n",
     "  url, title, score\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  LENGTH(title) > 10\n",
     "  AND score > 10\n",
@@ -194,10 +194,10 @@
    "source": [
     "%%bigquery --project $PROJECT\n",
     "SELECT\n",
-    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "  COUNT(title) AS num_articles\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "  AND LENGTH(title) > 10\n",
@@ -226,10 +226,10 @@
     "query=\"\"\"\n",
     "SELECT source, LOWER(REGEXP_REPLACE(title, '[^a-zA-Z0-9 $.-]', ' ')) AS title FROM\n",
     "  (SELECT\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "    title\n",
     "  FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "  WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",

diff --git a/courses/machine_learning/deepdive/09_sequence/reusable-embeddings.ipynb b/courses/machine_learning/deepdive/09_sequence/reusable-embeddings.ipynb
@@ -126,7 +126,7 @@
     "SELECT\n",
     "    url, title, score\n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    LENGTH(title) > 10\n",
     "    AND score > 10\n",
@@ -150,10 +150,10 @@
     "%%bigquery --project $PROJECT\n",
     "\n",
     "SELECT\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "    COUNT(title) AS num_articles\n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",
@@ -182,10 +182,10 @@
     "sub_query = \"\"\"\n",
     "SELECT\n",
     "    title,\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[OFFSET(1)] AS source\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[SAFE_OFFSET(1)] AS source\n",
     "    \n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '{0}'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",

diff --git a/courses/machine_learning/deepdive/09_sequence/text_classification.ipynb b/courses/machine_learning/deepdive/09_sequence/text_classification.ipynb
@@ -172,7 +172,7 @@
     "SELECT\n",
     "  url, title, score\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  LENGTH(title) > 10\n",
     "  AND score > 10\n",
@@ -195,10 +195,10 @@
    "source": [
     "%%bigquery --project $PROJECT\n",
     "SELECT\n",
-    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "  COUNT(title) AS num_articles\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "  AND LENGTH(title) > 10\n",
@@ -227,10 +227,10 @@
     "query=\"\"\"\n",
     "SELECT source, LOWER(REGEXP_REPLACE(title, '[^a-zA-Z0-9 $.-]', ' ')) AS title FROM\n",
     "  (SELECT\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "    title\n",
     "  FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "  WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",

diff --git a/courses/machine_learning/deepdive/09_sequence/word2vec.ipynb b/courses/machine_learning/deepdive/09_sequence/word2vec.ipynb
@@ -67,7 +67,7 @@
     "  \" \", \n",
     "  LOWER(REGEXP_REPLACE(text, '[^a-zA-Z $-]', ' '))) AS text\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  LENGTH(title) > 100\n",
     "  AND LENGTH(text) > 100\n",

diff --git a/courses/machine_learning/deepdive/09_sequence_keras/labs/text_classification.ipynb b/courses/machine_learning/deepdive/09_sequence_keras/labs/text_classification.ipynb
@@ -83,7 +83,7 @@
     "SELECT\n",
     "  url, title, score\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  LENGTH(title) > 10\n",
     "  AND score > 10\n",
@@ -108,10 +108,10 @@
    "source": [
     "query=\"\"\"\n",
     "SELECT\n",
-    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "  COUNT(title) AS num_articles\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "  AND LENGTH(title) > 10\n",
@@ -140,10 +140,10 @@
     "query=\"\"\"\n",
     "SELECT source, LOWER(REGEXP_REPLACE(title, '[^a-zA-Z0-9 $.-]', ' ')) AS title FROM\n",
     "  (SELECT\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "    title\n",
     "  FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "  WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",

diff --git a/courses/machine_learning/deepdive/09_sequence_keras/text_classification.ipynb b/courses/machine_learning/deepdive/09_sequence_keras/text_classification.ipynb
@@ -102,7 +102,7 @@
     "SELECT\n",
     "  url, title, score\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  LENGTH(title) > 10\n",
     "  AND score > 10\n",
@@ -125,10 +125,10 @@
    "source": [
     "%%bigquery --project $PROJECT\n",
     "SELECT\n",
-    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "  ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "  COUNT(title) AS num_articles\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "  AND LENGTH(title) > 10\n",
@@ -157,10 +157,10 @@
     "query=\"\"\"\n",
     "SELECT source, LOWER(REGEXP_REPLACE(title, '[^a-zA-Z0-9 $.-]', ' ')) AS title FROM\n",
     "  (SELECT\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "    title\n",
     "  FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "  WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",

diff --git a/courses/machine_learning/deepdive/09_sequence_keras/word2vec.ipynb b/courses/machine_learning/deepdive/09_sequence_keras/word2vec.ipynb
@@ -67,7 +67,7 @@
     "  \" \", \n",
     "  LOWER(REGEXP_REPLACE(text, '[^a-zA-Z $-]', ' '))) AS text\n",
     "FROM\n",
-    "  `bigquery-public-data.hacker_news.stories`\n",
+    "  `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "  LENGTH(title) > 100\n",
     "  AND LENGTH(text) > 100\n",

diff --git a/.../machine_learning/deepdive2/text_classification/labs/automl_for_text_classification.ipynb b/.../machine_learning/deepdive2/text_classification/labs/automl_for_text_classification.ipynb
@@ -85,7 +85,7 @@
     "Hacker news headlines are available as a BigQuery public dataset. The [dataset](https://console.cloud.google.com/bigquery?p=bigquery-public-data&d=hacker_news&page=table&t=stories) contains all headlines from the sites inception in October 2006 until October 2015. \n",
     "\n",
     "### Lab Task 1a: \n",
-    "Complete the query below to create a sample dataset containing the `url`, `title`, and `score` of articles from the public dataset `bigquery-public-data.hacker_news.stories`. Use a WHERE clause to restrict to only those articles with\n",
+    "Complete the query below to create a sample dataset containing the `url`, `title`, and `score` of articles from the public dataset `bigquery-public-data.hacker_news.full`. Use a WHERE clause to restrict to only those articles with\n",
     "* title length greater than 10 characters\n",
     "* score greater than 10\n",
     "* url length greater than 0 characters"
@@ -134,10 +134,10 @@
     "%%bigquery --project $PROJECT\n",
     "\n",
     "SELECT\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "    # TODO: Your code goes here.\n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "    # TODO: Your code goes here.\n",
@@ -166,10 +166,10 @@
     "sub_query = \"\"\"\n",
     "SELECT\n",
     "    title,\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[OFFSET(1)] AS source\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[SAFE_OFFSET(1)] AS source\n",
     "    \n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '{0}'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",

diff --git a/...s/machine_learning/deepdive2/text_classification/labs/keras_for_text_classification.ipynb b/...s/machine_learning/deepdive2/text_classification/labs/keras_for_text_classification.ipynb
@@ -77,7 +77,7 @@
     "Hacker news headlines are available as a BigQuery public dataset. The [dataset](https://console.cloud.google.com/bigquery?project=bigquery-public-data&page=table&t=stories&d=hacker_news&p=bigquery-public-data&redirect_from_classic=true) contains all headlines from the sites inception in October 2006 until October 2015. \n",
     "\n",
     "### Lab Task 1a: \n",
-    "Complete the query below to create a sample dataset containing the `url`, `title`, and `score` of articles from the public dataset `bigquery-public-data.hacker_news.stories`. Use a WHERE clause to restrict to only those articles with\n",
+    "Complete the query below to create a sample dataset containing the `url`, `title`, and `score` of articles from the public dataset `bigquery-public-data.hacker_news.full`. Use a WHERE clause to restrict to only those articles with\n",
     "* title length greater than 10 characters\n",
     "* score greater than 10\n",
     "* url length greater than 0 characters"
@@ -126,10 +126,10 @@
     "%%bigquery --project $PROJECT\n",
     "\n",
     "SELECT\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "    # TODO: Your code goes here.\n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "    # TODO: Your code goes here.\n",
@@ -158,10 +158,10 @@
     "sub_query = \"\"\"\n",
     "SELECT\n",
     "    title,\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[OFFSET(1)] AS source\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[SAFE_OFFSET(1)] AS source\n",
     "    \n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '{0}'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",

diff --git a/...ine_learning/deepdive2/text_classification/solutions/automl_for_text_classification.ipynb b/...ine_learning/deepdive2/text_classification/solutions/automl_for_text_classification.ipynb
@@ -98,7 +98,7 @@
     "SELECT\n",
     "    url, title, score\n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    LENGTH(title) > 10\n",
     "    AND score > 10\n",
@@ -122,10 +122,10 @@
     "%%bigquery --project $PROJECT\n",
     "\n",
     "SELECT\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[OFFSET(1)] AS source,\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.'))[SAFE_OFFSET(1)] AS source,\n",
     "    COUNT(title) AS num_articles\n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '.*://(.[^/]+)/'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",
@@ -154,10 +154,10 @@
     "sub_query = \"\"\"\n",
     "SELECT\n",
     "    title,\n",
-    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[OFFSET(1)] AS source\n",
+    "    ARRAY_REVERSE(SPLIT(REGEXP_EXTRACT(url, '{0}'), '.'))[SAFE_OFFSET(1)] AS source\n",
     "    \n",
     "FROM\n",
-    "    `bigquery-public-data.hacker_news.stories`\n",
+    "    `bigquery-public-data.hacker_news.full`\n",
     "WHERE\n",
     "    REGEXP_CONTAINS(REGEXP_EXTRACT(url, '{0}'), '.com$')\n",
     "    AND LENGTH(title) > 10\n",