Merge pull request #18 from probcomp/gg/pre-commit

Run pre-commit on all files
probcomp · Jul 23, 2024 · f6efcd5 · f6efcd5
2 parents bd3bcb5 + 7351d5a
commit f6efcd5
Show file tree

Hide file tree

Showing 18 changed files with 75 additions and 47 deletions.
diff --git a/.pre-commit-config.yaml b/.pre-commit-config.yaml
@@ -1,8 +1,9 @@
 repos:
-  - repo: https://github.com/asottile/reorder-python-imports
-    rev: v3.13.0
+  - repo: https://github.com/pycqa/isort
+    rev: 5.13.2
     hooks:
-    - id: reorder-python-imports
+      - id: isort
+        args: [--profile, black, --force-single-line-imports]
   - repo: https://github.com/psf/black-pre-commit-mirror
     rev: 24.4.2
     hooks:

diff --git a/docs/gen_reference_page.py b/docs/gen_reference_page.py
@@ -7,9 +7,9 @@
 nav = mkdocs_gen_files.Nav()
 
 for path in sorted(Path("hfppl").rglob("*.py")):
-    if any(part.startswith('.') for part in path.parts):
+    if any(part.startswith(".") for part in path.parts):
         continue
-    
+
     module_path = path.relative_to(".").with_suffix("")
     doc_path = path.relative_to(".").with_suffix(".md")
     full_doc_path = Path("reference", doc_path)
@@ -22,13 +22,13 @@
     elif parts[-1] == "__main__":
         continue
 
-    nav[parts] = doc_path.as_posix()  # 
+    nav[parts] = doc_path.as_posix()  #
 
     with mkdocs_gen_files.open(full_doc_path, "w") as fd:
         ident = ".".join(parts)
         fd.write(f"::: {ident}")
 
     mkdocs_gen_files.set_edit_path(full_doc_path, path)
 
-with mkdocs_gen_files.open("reference/SUMMARY.md", "w") as nav_file:  # 
-    nav_file.writelines(nav.build_literate_nav())  # 
+with mkdocs_gen_files.open("reference/SUMMARY.md", "w") as nav_file:  #
+    nav_file.writelines(nav.build_literate_nav())  #
diff --git a/examples/grammar_constraint.py b/examples/grammar_constraint.py
@@ -14,13 +14,13 @@
 import os
 from typing import List
 
+from synchromesh.completion_engine import LarkCompletionEngine
+from synchromesh.synchromesh import StreamingCSD
+
 from hfppl.distributions import LMContext
+from hfppl.inference import smc_standard
 from hfppl.llms import CachedCausalLM
 from hfppl.modeling import Model
-from hfppl.inference import smc_standard
-
-from synchromesh.completion_engine import LarkCompletionEngine
-from synchromesh.synchromesh import StreamingCSD
 
 
 class GrammarConstrainedSMC(Model):

diff --git a/examples/haiku.py b/examples/haiku.py
@@ -1,8 +1,14 @@
-from hfppl import Model, CachedCausalLM, LMContext, smc_standard, sample_word
 import asyncio
-import nltk
 import os
 
+import nltk
+
+from hfppl import CachedCausalLM
+from hfppl import LMContext
+from hfppl import Model
+from hfppl import sample_word
+from hfppl import smc_standard
+
 # download the CMU pronunciation dictionary (if we haven't already)
 nltk.download("cmudict")
 

diff --git a/examples/hard_constraints.py b/examples/hard_constraints.py
@@ -1,8 +1,11 @@
-import string
 import asyncio
-from hfppl import Model, CachedCausalLM, LMContext, smc_standard
-
 import os
+import string
+
+from hfppl import CachedCausalLM
+from hfppl import LMContext
+from hfppl import Model
+from hfppl import smc_standard
 
 if "HF_AUTH_TOKEN" in os.environ:
     HF_AUTH_TOKEN = os.environ["HF_AUTH_TOKEN"]

diff --git a/hfppl/__init__.py b/hfppl/__init__.py
@@ -1,9 +1,9 @@
 """Probabilistic programming with HuggingFace Transformer models.
 """
 
-from .util import *
-from .llms import *
+from .chunks import *
 from .distributions import *
-from .modeling import *
 from .inference import *
-from .chunks import *
+from .llms import *
+from .modeling import *
+from .util import *
diff --git a/hfppl/chunks.py b/hfppl/chunks.py
@@ -1,4 +1,5 @@
 import string
+
 from .modeling import submodel
 
 

diff --git a/hfppl/distributions/__init__.py b/hfppl/distributions/__init__.py
@@ -11,10 +11,10 @@
 * `LMContext(lm: hfppl.llms.CachedCausalLM, prompt: list[int]).mask_dist(mask: set[int]) -> bool`
 """
 
+from .bernoulli import Bernoulli
 from .distribution import Distribution
 from .geometric import Geometric
+from .lmcontext import LMContext
 from .logcategorical import LogCategorical
 from .tokencategorical import TokenCategorical
 from .transformer import Transformer
-from .lmcontext import LMContext
-from .bernoulli import Bernoulli
diff --git a/hfppl/distributions/bernoulli.py b/hfppl/distributions/bernoulli.py
@@ -1,7 +1,7 @@
-from .distribution import Distribution
-
 import numpy as np
 
+from .distribution import Distribution
+
 
 class Bernoulli(Distribution):
     """A Bernoulli distribution."""

diff --git a/hfppl/distributions/geometric.py b/hfppl/distributions/geometric.py
@@ -1,6 +1,7 @@
-from .distribution import Distribution
 import numpy as np
 
+from .distribution import Distribution
+
 
 class Geometric(Distribution):
     """A Geometric distribution."""

diff --git a/hfppl/distributions/lmcontext.py b/hfppl/distributions/lmcontext.py
@@ -1,9 +1,12 @@
-from ..util import log_softmax, logsumexp
-from .distribution import Distribution
-from ..llms import Token
-import numpy as np
 import copy
 
+import numpy as np
+
+from ..llms import Token
+from ..util import log_softmax
+from ..util import logsumexp
+from .distribution import Distribution
+
 
 class LMNextToken(Distribution):
 
@@ -157,9 +160,9 @@ def token_count(self):
     def __str__(self):
         full_string = self.lm.tokenizer.decode(self.tokens)
         if not self.show_prompt:
-            full_string = full_string[self.prompt_string_length:]
+            full_string = full_string[self.prompt_string_length :]
         if not self.show_eos and full_string.endswith(self.lm.tokenizer.eos_token):
-            full_string = full_string[:-len(self.lm.tokenizer.eos_token)]
+            full_string = full_string[: -len(self.lm.tokenizer.eos_token)]
         return full_string
 
     def __deepcopy__(self, memo):

diff --git a/hfppl/distributions/logcategorical.py b/hfppl/distributions/logcategorical.py
@@ -1,7 +1,8 @@
-from .distribution import Distribution
-from ..util import log_softmax
 import numpy as np
 
+from ..util import log_softmax
+from .distribution import Distribution
+
 
 class LogCategorical(Distribution):
     """A Geometric distribution."""

diff --git a/hfppl/distributions/tokencategorical.py b/hfppl/distributions/tokencategorical.py
@@ -1,9 +1,10 @@
-from .distribution import Distribution
-from ..util import log_softmax
-from ..llms import Token
 import numpy as np
 import torch
 
+from ..llms import Token
+from ..util import log_softmax
+from .distribution import Distribution
+
 
 class TokenCategorical(Distribution):
 

diff --git a/hfppl/distributions/transformer.py b/hfppl/distributions/transformer.py
@@ -1,7 +1,9 @@
-from .distribution import Distribution
-from ..llms import TokenSequence, Token
 import numpy as np
 
+from ..llms import Token
+from ..llms import TokenSequence
+from .distribution import Distribution
+
 
 # Transformer(lm, prompt) -- where prompt can either be a string or a list of Tokens.
 class Transformer(Distribution):

diff --git a/hfppl/inference/smc_record.py b/hfppl/inference/smc_record.py
@@ -1,4 +1,5 @@
 import json
+
 import numpy as np
 
 

diff --git a/hfppl/inference/smc_standard.py b/hfppl/inference/smc_standard.py
@@ -1,9 +1,11 @@
+import asyncio
 import copy
-from ..util import logsumexp
+from datetime import datetime
+
 import numpy as np
-import asyncio
+
+from ..util import logsumexp
 from .smc_record import SMCRecord
-from datetime import datetime
 
 
 async def smc_standard(

diff --git a/hfppl/inference/smc_steer.py b/hfppl/inference/smc_steer.py
@@ -1,7 +1,10 @@
-import numpy as np
-import copy
 import asyncio
-from ..util import logsumexp, softmax
+import copy
+
+import numpy as np
+
+from ..util import logsumexp
+from ..util import softmax
 
 
 def find_c(weights, N):

diff --git a/hfppl/llms.py b/hfppl/llms.py
@@ -1,10 +1,13 @@
 """Utilities for working with HuggingFace language models, including caching and auto-batching."""
 
-import torch
-from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 import asyncio
 import string
 
+import torch
+from transformers import AutoModelForCausalLM
+from transformers import AutoTokenizer
+from transformers import BitsAndBytesConfig
+
 
 class Masks:
     def __init__(self, lm):
Original file line number	Diff line number	Diff line change
		@@ -1,4 +1,5 @@
		import string

		from .modeling import submodel


Expand Down