`with_columns`

Return a version of your df back including all of it's columns. An argument is required, even if you're just selecting a column.
It's important to know for many operations used in cleaning Data.

df.with_columns(your_argument)
df.with_columns(Polars.col("selected_column"))

`Polars.col` vs `get_column`

Polars.col selects your specified column from the DataFrame and returns a Dataframe(if used on a DataFrame). I recommend this as the go to for most cleaning Data operations.

df.select(Polars.col("year"))
=>
shape: (6, 1)
┌──────┐
│ year │
│ ---  │
│ i64  │
╞══════╡
│ 1984 │
│ 1985 │
│ 1993 │
└──────┘

df.get_column("column_name")
When doing mathematical operations(excluding comparisons <, >, etc) and transforming values with a hash, we want to work with a series. This method returns the selected column as a Series

df.get_column("year")
=>
shape: (6,)
Series: 'year' [i64]
[
	1984
	1985
	1993
	1993
	2010
	1999
]

Use get_columns if you would like to get all columns returned as an Array of Series

df.get_columns

Turning JSON into a DataFrame

df = Polars::DataFrame.new(json_response["response"]["data"])

Renaming All Columns

df.columns = ["your", "new", "column", "names"]

Renaming a Single or Multiple Columns

df.rename({"foo" => "apple"})
df.rename({"foo" => "apple", "bar" => "orange"})

Finding Null and Nan

df.null_count

#Count of all the NaNs
nan_cols = movie_df.get_columns.filter_map { |col| col.name if col.is_numeric}
df.select(Polars.col(nan_cols).is_nan.sum)

#Specific Columns with NaN
df.filter(Polars.col("column_name").is_nan)

Filling Null and Nan

df = df.with_columns(Polars.col("column_name").fill_null(Polars.lit("Value")))

df = df.with_columns(Polars.col("column_name").fill_nan(7.5))

Dropping Null and Nan

df.drop_nulls()
df.drop_nans()

Filtering

df.filter(Polars.col("column_name") == Value)

Add Column

# Insert same value in each row.
df.with_columns(Polars.lit("Value").alias("column_name"))

#Insert a Series of Values as new column
df.with_columns(your_series.alias("column_name"))
)

#Removing Columns

#Remove a single column
df = df.drop("column_name")

#Remove multiple columns
df = df.drop(["column_one", "column_two"])

Convert String column to DateTime

df.with_columns(Polars.col("date_added").str.to_datetime(format = "%m/%d/%Y", time_unit: "ns"))

Combining DataFrames

# Add rows to first DataFrame from second
df = df.vstack(df_two)

#Add columns to first DataFrame from second
df = df.hstack(df_two)

# Join
df = df.join(df_two, on="column_name", how=["inner", "left" "outer", "semi" "anti" "cross"])

Dropping Duplicates

df = df.unique(subset:["column_name"])

Creating Month column from DateTime column

df = df.with_columns(Polars.col("date").month.alias("month"))

Converting Column Values with Hash from one type to another

month_hash = {1 => "January", 2 => "February", 3 => "March", 4 => "April", 5 => "May", 6 => "June", 7 => "July", 8 => "August", 9 => "September", 10 => "October", 11 => "November", 12 => "December"}
month_names = df.get_column("month").map { |k| month_hash[k] }
df = df.with_columns(month_names.alias("month"))

Creating Charts

#Add to Gemfile and install  
gem "vega"  
 
#Install and import JS dependencies
import "vega"
import "vega-lite"
import "vega-embed"

# In controller  
def index
  @movie_df = Polars::DataFrame.new(Movie.all)
end

#In erb/template file  
<%= @movie_df.plot("name", "rank", type: "line")

Column-wise Operations

# Single Column
df.get_column("column_name") * value
df.get_column("column_name") / value
df.get_column("column_name") - value
df.get_column("column_name") + value

# Operations on columns with column
df.get_column("column_one") * df.get_column("column_two")
df.get_column("column_one") / df.get_column("column_two")
df.get_column("column_one") - df.get_column("column_two")
df.get_column("column_one") + df.get_column("column_two")

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

polars_cheatsheet.md

polars_cheatsheet.md

`with_columns`

`Polars.col` vs `get_column`

Turning JSON into a DataFrame

Renaming All Columns

Renaming a Single or Multiple Columns

Finding Null and Nan

Filling Null and Nan

Dropping Null and Nan

Filtering

Add Column

Convert String column to DateTime

Combining DataFrames

Dropping Duplicates

Creating Month column from DateTime column

Converting Column Values with Hash from one type to another

Creating Charts

Column-wise Operations

Files

polars_cheatsheet.md

Latest commit

History

polars_cheatsheet.md

File metadata and controls

with_columns

Polars.col vs get_column

Turning JSON into a DataFrame

Renaming All Columns

Renaming a Single or Multiple Columns

Finding Null and Nan

Filling Null and Nan

Dropping Null and Nan

Filtering

Add Column

Convert String column to DateTime

Combining DataFrames

Dropping Duplicates

Creating Month column from DateTime column

Converting Column Values with Hash from one type to another

Creating Charts

Column-wise Operations

`with_columns`

`Polars.col` vs `get_column`